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Die Humankybernetik (Anthropokybernetik) umfaßt alle jene Wissenschaftszweige, welche nach dem Vorbild 
der neuzeitlichen Naturwissenschaftversuchen, Gegenstände, die bisher ausschließlich mit geisteswissenschaftlichen 
Methoden bearbeitet wurden, auf Modelle abzubilden und mathematisch zu analysieren, Zu den Zweigen der 
Humankybernetik gehören vor allem die Informationspsychologie (einschließlich der Kognitions- 
forschung, der Theorie über „künstliche Intelligenz” und der modellierenden Psychopathometrie und Geriatrie), 
die Informationsästhetik und die kybernetische Pädagogik, aber auchdie Sprachkyber 
netik (einschließlich der Textstatistik, der mathematischen Linguistik und der konstruktiven Interlinguistik) Inhalt Enhavo * Contents * Sommaire Band 38 * Heft 3 * Sept. 1997 
sowie die Wirtschafts, Sozial und Rechtskybernetik.- Neben diesem ihrem hauptsächtlichen The- 
menbereich pflegen die GrKG/Humankybernetik durch gelegentliche Ubersichtsbeiträge und interdisziplinär 
interessierende Originalarbeiten auch die drei anderen Bereiche der kybernetischen Wissenschaft: die Bi o- 








kybernetik, die Ing e nie urkybernetik und die Allgemeine Kybernetik (Strukturtheorie Zdenek Pülpan / Hradec Kralove 
informationeller Gegenstände). Nicht zuletzt wird auch metakybernetische n Themen Raum gegeben: Ĥ ; sse . . . 
nicht nur der Philosophie und Geschichte der Kybernetik, sondern auch der auf kybernetische Inhalte bezogenen Denove pri la plej originala, la plej probabla kaj la plej akceptebla solvo 
Piidagogik und Literaturwissenschaft. - de problemo 
La prihoma kibernetiko (antropokibernetiko) inkluzivas ĉiujn tiajn sciencobranĉojn, kiuj imitante la novepokan (New about the most original, probable and acceptable problem solution) 
natursciencon, klopodas bildigi per modeloj kaj analizi matematike objektojn ĝis nun pritraktitajn ekskluzive 
per kultursciencaj metodoj. Apartenas al la branĉaro de la antropokibernetiko ĉefe la kibernetika psiko- Ĥ 
logio (inkluzive la ekkon-esploron, la teoriojn pri „artefarita intelekto’’ kaj la modeligajn psikopatometrion Diana Faloba / Helmar Frank 
kaj geriatrion), la kibernetika estetiko kajla kibernetika pedagogio, sed ankaŭ la lingvo- i A 7 
kibernetiko (inkluzive la tekststatistikon,la matematikan lingvistikon kaj la konstruan interlingvistikon) Versuch (Mai ergänzenden Auswertung des Schlüsselversuchs der 
same kiella klbernetika ekonomio,la socikibernetiko kaj la jurkibernetiko. - Krom tiu ĉi Informationspsychologie 


sia ĉefa temaro per superrigardaj artikoloj kaj interfake interesigaj originalaj laboraöj GrKG/HUMANKYBER- 
NETIK flegas okaze ankaŭ la tri aliajn kampojn de la kibernetika scienco: la biokibernetikon, la inĝe- 
nierklbernetikon kajla ĝeneralan kibernetikon (strukturteorion de informecaj objektoj). Ne 
lastavice trovas lokon ankaŭ metakibernetikaj temoj: ne nur la filozofio kaj historio de la kibernetiko, ; 
sed ankaŭ la pedagogio kaj literaturscienco de kibernetikaj sciafoj. - Stanislav Komenda 


Cybernetics of Social Systems comprises all those branches of science which apply mathematical models and Didaktischer Test vom statistischen Gesichtspunkt betrachtet 


methods of analysis to matters which had previously been the exclusive domain of the humanities. Above all (Lernejsukcesa testo el statistika vidpunkto) 
this includes information psychology (including theories of cognition and “artificial intelligence' as well as 
psychopathometrics and geriatrics), aesthetics of Information and cybernetic educational theory, cybernetic 
linguistics (including text-statistics, mathematical linguistics and constructive interlinguistics) as wellaseconomic, 


(Provo kompletige ekspluati la ŝlosileksperimenton de la informacipsikologio) 


social and juridical cybernetics. - In addition to its principal areas of interest, the GrKG/HUMANKYBERNETIK Josef Brody / Milan Hejny 
offers a forum for the publication of articles of a general nature in three other fields: biocybernetics, cybernetic ŝ S . ; 
engineering and general cybernetics (theory of informational structure). There is also room for metacybernetic A Mathematical Analysis of Problem Situations ki Structure and MAPLE 
subjects: not just the history and philosophy of cybernetics but also cybernetic approaches to education and (Matematika analizo de problemaj situacioj. Strukturo kaj MAPLE) 
literature are welcome. 
La cybernĉtique sociale contient tous le branches scientifiques, qui cherchent a imiter les sciences naturelles Pierre-Olivier El Guedj / Pierre Nugues 


modernes en projetant sur des modeles et en analysant de maniere mathĉmatique des objets, qui etaient traites ; ; . . o 
auparavant exclusivement par des methodes des sciences culturelles („ideographiques''). Parmi les branches de Analyse syntaxique combinant deux formalismes aus sem d un Chart 
la cybernĉtique sociale il y a en premier lieu la psychologie informationelle (inclues la recherche de la cognition, | hierarchique 

les thĉories de l’Intelligence artificielle et la peychopathomĉtrie et gĉriatrie modeliste), l'esthetique informa- 
tionelle et la pedagogie cybernĉtique, mais aussi la cybernĉtique linguistique (inclues la statistique de textes, la 
linguistique mathematique et l'interlinguistique constructive) ainsi que la cybernĉtique en e€conomie, sociologie 
et jurisprudence, En plus de ces principaux centres d'interĉt la revue GrKG/HUMANKYBERNETIK s'occupe - 
par quelques articles de synthĉse et des travaux originaux d 'int€rĉt interdisciplinaire - dgalement des trois autres 
champe de la science cybernetique: la biocybernĉtique, la cybernĉtique de l'ingenieur et la cybernetique genĉe- 
rale (theorie des structures des objets informationels). Une place est ĉgalement accoraĉe aux sujets metacyber- 
netiques mineurs: la philosophie et l'histoire de la cybernĉtique mais aussi la p&dagogie dans la mesure oŭ elle 
concernent la cybernĉtique. 


(Sintaksa analizo kombinanta du formalismojn ene de la hierarĥia ĉarto) 
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Denove pri la plej originala, la plej probabla kaj la plej akceptebla solvo de 
problemo 


de Zdenĉk PÜLPÄN, Hradec Kralove (CZ) 


el la Vysokä ŝkola pedagogickä Hradec Kralove 


En ĉi tiu artikolo mi provas denove difini gradon de la originaleco (vidu Pŭlpan 
1993, Frank 1993), poste mi rememorigos la algoritmon de la plej verŝajna solvo kaj 
rimarkigos eblecon de trovo de la plej akceptebla solvo sur la bazo de la ekspertaj taksoj. 

Ni supozas, ke ĉiuj solvoj de certa klaso de reprezentantaj taskoj povas esti 
priskribitaj per orientita arba grafikaĵo, kies nodoj prezentas decidadojn kaj strekoj 
prezentas certajn decidojn. Stimante probablojn de apartaj decidaĵoj, la probablo de certa 
solvo estas donata per produkto de probabloj de korespondantaj strekoj de ĝiaj partaj 
solvoj. Se k estas la nombro de ĉiuj eblaj solvoj kaj P (i) la probablo de la i-a solvo (I£ i 
< k) la kvanto H de informacio pri elekto de certa tipo de solvo per hazarde elektita 
respondanto estas donata per entropio (1): 


© H=-S P())-log, Pf) [bit] (D 
i=l 


La solvo de tasko estas ĉi tie komprenata kiel fina progreso de partaj solvoj (en nia 
grafika interpretado tio korespondas al orientita vojo de radiko al certa folio). 
En ĉiu parta solvita paŝo oni povas stimi transinformon 7 kiel la sumon 


I=log,n+ 2, plop pio ZE =l 


kie n .estas la nombro de eblaj decidaĵoj en tiu paŝo kun la probabloj 
D1,P2»»..,P,(Z p; =l). Poste por ĉiu progreso de solvitaj paŝoj oni povas fiksi 
maksimumon el partaj transinformoj. Por individualaj solvoj oni tiel ricevos valorojn de 
responditaj maksimumoj /,, 7,,...1,.. Ni proponos poste indiki tiun solvon kiel la plej 
originala (en nia senco), por kiu la korespondanta valoro de / estas la plej granda (el ĉiuj 
nodoj de apartenanta solvo) kaj al tio la apartenanta vojo enhavas strekon de nodo kun la 
plej granda valoro de 7, kiu havas ankaŭ la plej malgrandan probablon el ĉiuj elirantaj 
strekoj de la nodo. 





100 Zdenek Pülpan 





Mezuro de originaleco devas esti relativa, t.e. rilatanta al destinata referenca 
algoritmo. Tio estos ekzemple la algoritmo al kiu apartenas vojo kun la plej malgranda 
maksimumo 79 de transinformacioj el ĉiuj nodoj kaj kun streko eliranta el tiu nodo kun 
la plej granda probablo p”. Se la maksimumo de transinformacioj el ĉiuj nodoj de 
korespondanta algoritmo 7 estas la mezuro de originaleco w egalas al 


= “= = AL ; O=0 (2) 


kie p estas la probablo korespondanta al elira streko el nodo kun la plej granda 
transinformacio, kiu estas parto de konsiderata algoritmo. 

Pli grandaj valoroj de @ atestas pri granda originaleco de la solvo. 

La plej probablan vojon en grafikaĵo oni trovos per konvena algoritmo (ekz. per 
metodo de Danzig). Ni povas procede al ĉiuj nodoj de grafikaĵo aldoni valoron v;: 


a) al enira nodo ni aldonos la valoron 1, al la aliaj nodoj ni fiksas valoron 0; 
b) ni serĉos tiujn strekojn inter nodoj i, j, por kiuj 


Vi XV; ' Di 


kie p; e<0,1> estas la probablo de transiro en grafikaĵo el la i-a nodo en la j-an 
nodon; se ni trovos tian strekon, ni ŝanĝos la valoron de la variablo v;en 


Vi = Vi Dii 
c) laŭ b) ni procedos ĝis por ĉiuj strekoj ij valoros 
V; 2 Di G) 


d) Tuj kiam la procedo laŭ antaŭpaŝoj estas finita, estas eble difini tian progreson (aŭ 
tiajn progresojn) de strekoj, kiu (aŭ kiuj) kunigas eniron (en radikon) kun eliro (kun 
korespondanta folio), por kiuj 


Vi = Vi" Di: (4) 


Tuj strekoj kreas la optimuan vojon kun la maksimuma probablo egala al la valoro v 
de eliro. 

Dum valorado de solvo de certa problemo estu la valoradisto kapabla siajn imagojn 
kaj postulojn por solvo antaŭe specifi. Kompleta specifo ne estas ebla. Tial por 
objektivigo de valorado estas necese respekti tiun metodon, kiu el pli multaj vidpunktoj 
argumentate elektos la plej relevantajn vidpunktojn. Tiuj vidpunktoj tamen povas esti 
konfliktaj aŭ komunaj, per ilia akceptado povas diversaj taksantoj gajni diversajn 
taksaĵojn de la solvo de problemo. 
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Ĉiu taksado en la situacioj kiam la taksanto estas homo, estas karakterizata per 
neprecizeco kaj kompromiso en multaj aspektoj. Tion necesos respekti dum interpretado 
de preferencoj de variantoj de solvo. 

Ni marku relevantajn vidpunktojn de solvo de problemo per R,,R,..,R, kaj per 
X1»X2,---»x, variantojn de eblaj solvoj de problemo. 

Ni supozu, ke al ĉiu vidpunkto de taksado R, estas donata sinsekvo de „konveneco“ 
de variantoj (la plej konvena varianto havos la plej malaltan sinsekvon). 

Unu el kriterioj por fikso de variantoj estas kalkulo de sumo de iliaj sinsekvoj por 
apartaj vidpunktoj. Plej bone estos poste taksata tiu varianto, kiu havos la plej malaltan 
sumon de sinsekvoj. Sed oni supozas, ke ĉiuj sinsekvoj kaj ĉiuj karakterizaĵoj havas 
egalan pezon. 

Tial estas iam konvene enkonduki matricon A= (4;),.„, kies elementoj a, deter- 
minas, kiomoble estas varianto x; taksata kiel j-a en sinsekvo de ĉiuj variantoj. 

Se estas donita vektoro v de pezoj de individuaj vidpunktoj 
= (V,,V»,...,V.), (9, 20;Yv, = D), oni povas difini ankaŭ matricon B = (b;),.. kies 
elementoj b, estas la sumo de pezoj de tiuj karakterizaĵoj, laŭ kiuj estas varianto x, 
taksata kiel en j-a en sinsekvo. Elementon 5, 
(nenormatan) mezuron de konveneco de aldonaĵo de la j-a sinsekvo al la i-a varianto. 


oni povas poste interpreti kiel 
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New about Ihe most original, probable and acceptable problem solution (Summary) 

In the research C - R tests of the predominantly mathematical way of thinking proved that significant 
characteristics of the mathematical way of thinking are the basis for the original solution made by the standard 
population. It concerns the analysis of single steps leading to the task solution when using a tree graph. Using the 
probability calculus of exact algorithms for the solution, it is possible to compare levels of various populations 
solving the same task. 

The paper presents the method for estimation of the best original solution as well as the most probable and 
preferable when using external a priori statements. 
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Versuch einer ergänzenden Auswertung des Schlüsselversuchs der Informations- 
psychologie 


von Helmar FRANK, Paderborn (D), und Diana FALOBA, Sibiu/Hermannstadt (RO) 
aus dem Institut für Kybernetik / Universität Paderborn (Direktor: Prof.Dr. Helmar Frank) 


1. „Bewußtsein“ als Schlüsselbegriff der Kybernetik 

„Man kann ohne den Begriff des BewuBtseins nicht in die Kybernetik hineinkommen, 
mit ihm aber nicht in ihr bleiben“ wurde an anderer Stelle (Frank, 1975, S. 51) zur Kenn- 
zeichnung des Konflikts zwischen Thema und Ziel der Kybernetik formuliert. Der pro- 
grammatische Aufbau der Kybernetik macht das „empfangene Zeichen“ zum Elementar- 
begriff, dessen Bestimmung „nur relativ zu einem Subjekt möglich“ ist, welches seiner- 
seits „zunächst naiv als Bewußtsein verstanden werden kann“ (Frank, 1995, S. 65; 1996a, 
S. 47£.). Ziel ist aber die (im Sinne von Schmidt, 1941:) Objektivierung geistiger Arbeit, 
zumindest die Vorausberechenbarkeit mentaler Prozesse im Sinne des für nomothetische 
Wissenschaften (im Sinne von W. Windelband) geltenden Comteschen Imperativs „savoir 
pour prevoir“. Beide Ziele machen methodisch eine modellierende Rekonstruktion des 
vorgegebenen und vorab cartesisch analysierten Phänomens erforderlich, damit Modellpa- 
rameter meßbar und miteinander verrechenbar werden (vgl. den nomothetischen Metho- 
denfünfschritt in Frank, 1995, S. 62 - 65; 1996a, S. 41 - 44). Das Subjekt wird dabei in 
der Objektwelt nachgebildet, wobei die ursprüngliche Ichigkeit und Einheit des Bewußt- 
seins, also seine Wesensmerkmale, außer Betracht bleiben. Stattdessen gilt es, partielle 
Fähigkeiten, wie insbesondere die Grenzen für die Schnelle der Aufnahme sowie für Dau- 
er und Umfang der Wahrung empfangener Zeichen, meßbar zu machen. 

Zur Spezialisierung auf die Humankybernetik, gehört es, die - in erster Linie durch die 
mathematische Informationstheorie Shannons (1948) - allgemein erreichte Meßbarkeit 
von Informationellem konkret anzuwenden, und zwar nicht, wie in der Konstruktkyberne- 
tik (d.h. der Ingenieur- oder Maschinenkybernetik), zur Aufstellung von Vorschriften für 
eine zu konstruierende (maschinentechnische) Objektivation, sondern zur quantitativen 
Beschreibung und exakten Erklärung der im ursprünglichen Subjekt selbst empirisch 
schon vorfindlichen, mentalen Prozesse. Dies gilt insbesondere für die Mikrohumanky- 
bernetik (Informationspsychologie und -ästhetik, Bildungs- und Sprachkkybernetik), die 
an der individuellen Informationsverarbeitung interessiert ist und auch Kommunikations- 
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kybernetik genannt wird (Frank, 1993, S. 192; Frank/Franke, 1997, S. 55 - 57). Dabei 
war zunächst die fundamentale Frage zu beantworten, ob der Mensch bei seiner mentalen 
Aktivität überhaupt irgendwo (unbewußt) ausschöpft, was informationstheoretisch mög- 
lich ist, ob also die Shannonsche Informationstheorie für die Humankybernetik überhaupt 
hilfreich ist. 

Nach Shannons Fundamentalsatz gibt es zu jedem Informationsübertragungskanal (zu 
einer anderen Stelle oder - bei Speichern - bis zu einem späteren Zeitpunkt) eine unüber- 
schreitbare Grenze seiner Übertragungsfähigkeit; genannt Kanalkapazität C, die aber bei 
geeigneter Codierung beliebig gut genutzt werden kann. Dabei sind einerseits C, anderer- 
seits die zu übertragende Nachricht in der von Shannon eingeführten und (auf Anregung 
von J.W. Tukey) „bit“ genannten Informationseinheit zu messen, und die Übertragbar- 
keit einer Nachricht nach ihrer geeigneten Codierung besteht genau dann, wenn ihr so 
gemessener (zu speichernder oder pro Zeiteinheit zu übertragender) Informationsgehalt 
die Kanalkapazität C nicht übersteigt. Ob im Einzelfall Nachrichten in diesem, durch C 
begrenzten Höchstumfang übertragen, also tatsächlich geeignet codiert werden, bleibt 
dabei offen und muß in jedem konstrukt-, bio- oder humankybernetischen Anwendungs- 
fall untersucht werden; Shannons Informationstheorie gehört zur allgemeinen Kybernetik. 


2. Der Schlüsselversuch zur Aufnahmefähigkeit des menschlichen Bewußtseins. 

Die Informationstheorie kann insbesondere für die Psychologie nur dann hohe Rele- 

vanz haben, wenn sich feststellen läßt, daß 

a) von Zeichenketten gleicher Länge in gleicher Zeit mehr Zeichen wahrgenommen wer- 
den, wenn sie weniger „Information“ enthalten (im Sinne des Shannonschen Informati- 
onsmaßes; Hilgers und Yashovardhan [1980, S. 37] führten dafür in ILo den Neologismus 
informacio ein), aber 

b) von diesen Zeichenketten in dieser Zeit gleichviel Informacio wahrgenommen wird, 
und 

c) daß Wahrnehmungszeit und wahrgenommene Informacio proportional zueinander 
sind. 

Für die Signalübertragung von den Rezeptoren, z.B. der Retina, zu den sensorischen 
Projektionszentren (also für die Perzeption) gilt dies sicher nicht: das häufige e wird nicht 
schneller perzipiert als das seltene x. Wenn überhaupt, dann kann die zeitsparende Codie- 
rung also nur anschließend, vor der Bewußtwerdung (Apperzeption), erfolgen. Das Psy- 
chostrukturmodell der Informationspsychologie (die früheste graphische Fassung findet 
sich in Frank, 1961, S. 19) postuliert für diese informationstheoretisch mögliche Op- 
timalkodierung den später (Frank/Meder, 1971, S. 41) so genannten „Akkomodator“ zur 
Eingabe in den (beliebig kurz denkbaren) Kanal zum Bewußtsein. Die neurophysiologi- 
sche (oder zumindest Modell-) Entsprechung des Bewußtseins wurde (Frank, 1961, S. 
19f.) „Kurzspeicher“ genannt. Die (zunächst im Hinblick auf ästhetische Probleme ge- 
stellte) Grundfrage lautet: Wird für diesen Kanal, also für die Apperzeption als zweiter 
Phase der Wahrnehmung, die informationstheoretisch bestehende Möglichkeit der redun- 
danzproportionalen Zeiteinsparung genutzt? Die zu bestimmende Kanalkapazität C ist 
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dann als Apperzeptionsschnelle in einem darauf aufzubauenden informationspsychologi- 
schen Kalkül verwendbar. 


100, 
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Bild 1: Von 10 - 500 msek lang gezeigten 8- 
Buchstaben-Folgen konnten Versuchspersonen ei- 
nen größeren Prozentsatz P richtig und an der 
richtigen Stelle wiedergeben, wenn die Folgen 
gewohnte Texte besser annäherten (0. - 4. Ord- 
nung), also redundanter waren (R = 090; 15%; 
| 2999; 43%), d. h. weniger Informacio insgesamt 
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Bild 2: Infolge gleichlanger Darbietungszeit wird 
redundanzunabhängig von jeder der in Bild 1 an- 
gesprochenen Buchstabenfolgen derselbe Betrag 
IP = 8HP = 8(1-R)H..P an Informacio aufge- 
nommen, also derselbe Prozentsatz ZP/8H = 
1PK38 bit) = (l-R)P der maximal in 8 Buchsta- 
ben unterbringbaren Informacio. (Aus Miller, 
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Ohne daß dort schon dieser Modellansatz und damit die Unterscheidung zwischen 
Perzeption und Apperzeption gemacht wäre, kann der Versuch von George A. Miller, 
Jerome S. Bruner und Leo Postman (1954 [im folgenden kurz „M/B/P“] - die Arbeit 
wurde bereits im Januar 1952 zur Veroffentlichung eingereicht) als wahrscheinlich erste 
eindeutige Bestätigung der Relevanzbedingungen (a) - durch Bild 1 - und (b) - durch Bild 
2 - gelten. Jedenfalls wurde er zum Schliisselversuch, der zum Ansatz der Information- 
spsychologie führte (Frank, 1959, S. 28 - 31) und in deren Schrifttum als solcher ständig 
zitiert wird (ausführlich vor allem in Frank, 1962, S. 94 - 97, 1964, S. 82-84, 1969, Bd. 2, 
S. 78 - 82, 1996, S. 75 - 79; v. Cube, 1965, S. 88 - 93; Weltner, 1970, S. 112; Frank und 
Wagner, 1982, S. 73 - 76). Diesen Versuch nannte A. Moles Ende 1958 in Paris mit 
Verweis auf die kurz zuvor erschienene Darstellung durch Cherry (1957, S. 280 - 283) als 
Argument, als er (von Frank) kritisch im Sinne der oben aufgeführten Kriterien (a,b) nach 
der psychologischen Relevanz der Informationstheorie befragt wurde. - M/B/P selbst 
hatten (der Denkweise des US-amerikanischen Behaviorismus getreu) ihre Untersuchung 
nicht zur Bestimmung einer „Apperzeptionsschnelle“ als Parameter für einen informati- 
onstheoretisch begründeten psychologischen Modellansatz ausgewertet. 

Die Bedingung (c) ist eine Folge von (b) und der fast trivialen Unterstellung, daß - von 
Ermüdungserscheinungen abgesehen - von Zeichenketten konstanter mittlerer Informacio 
in jeder zusätzlichen Zeiteinheit gleichviel weitere Zeichen apperzipiert werden können. 
M/B/P machen hierzu keine Aussage. Die Originaldarstellung ihrer Ergebnisse (Bilder 1 
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und 2) läßt sogar vermuten, daß sie hieran überhaupt nicht dachten, denn sonst wäre die 
logarithmische Teilung der Zeitachse kaum noch durch die bessere Verteilung der Meß- 
punkte im Koordinatensystem zu rechtfertigen. Die Umzeichnung in lineare Koordinaten- 
systeme (erstmals in Frank, 1959, S. 29; verbesserte Fassungen finden sich u.a, in Frank, 
1962, S. 95, 1963, S. 83 und in v.Cube, 1965, S. 89) lag also nahe. Daß sie nicht zu einer 
augenfälligen Proportionalität zwischen der tachistoskopischen Expositionszeit und der 
wahrgenommenen Zeichenzahl oder Infomacio führte (Bild 3), wurde als Folge der 
„bekannten Nachwirkungserscheinungen“ erklärt (Frank, 1959, S. 36f., 1962, S. 95£, 
1969, Bd. 2, S. 80). Zeitproportionalität ist nur für die vom Akkomodator zum Kurzspei- 
cher fließende Informacio zu erwarten. Proportionalität ist also nicht zur Expositionszeit 
(Reizzeit) zu vermuten, sondern zur Apperzeptionszeit; diese ist um eine Nachwirkungs- 
zeit (t,) verlängert. 


R= 150% 
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Bild 3: Die Umzeichung von (A:) Bild 1 und (B:) Bild 2 in ein Koordinatensystem mit lincarer statt logarithmi- 
scher Abszissenteilung führt statt zu einer Zeitproportionalität des Prozentsatzes wahrgenommenen Zeichen (A) 
bzw. der wahrgenommenen Informacio (B) zu einer Knickstelle zwischen 40 msek und 100 msek, also in der 
Größenordnung des SZQ. (Nach Frank, 1959, $. 29.) 


Folgerichtig wurden daher schon in der informationsasthetischen Dissertation von 
Frank (1959, S. 29) als Apperzeptionsschnelle etwa 16 bit/sek dem Anstieg des zweiten 
Astes der M/B/P-Kurven entnommen. Dazu wurde keine genaue C-Bestimmung aus den 
Originaldaten von M/B/P versucht. Vielmehr wurde auf die mögliche Binärkodierung im 
Zentralnervensystem, auf die bei 1/16 sek liegende Schwelle des „Zeitsinns“ (dem 
„Moment“ oder „subjektiven Zeitquant [SZQ]) und auf die um 16 Hz streuenden elek- 
troenzephalographischen Beta-Wellen vorab der Ansatz aufgebaut, die Apperzeptions- 
schnelle sei genau 1 bit/SZQ (Frank, 1959, S. 28) „oder allenfalls ein ganzzahliges Viel- 
faches davon“ (Frank, 1962, S. 85). Der M/B/P-Versuch wurde somit zu einem Bestäti- 
gungsexperiment für eine vorab aufzustellende Theorie umgewertet (oder allenfalls zur 
empirischen Entscheidung zwischen diskreten theoretischen Möglichkeiten für C). 

Daß die zwischen 1/25 sek und 1/10 sek zu suchende Knickstelle der empirischen 
Kurven genau bei 1 SZQ » 1/16 sek liegt, wurde zunächst ohne Begründung unterstellt 
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(Frank, 1959, S. 29, 1962, S. 95f., S. 98), später als „möglich“ beiläufig erwähnt (Frank, 
1969, Bd. 2, S. 80). - 

Spätere Arbeiten führten zu weiteren Relativierungen, die es unzulässig machen, aus 
den M/B/P-Ergebnissen auf die natürliche Zahl n in der Gleichung C = 16n bit/sek zu 
schließen. Riedel (1965) bestätigte die Vermutung von Frank (1962, S. 96£.), daß C, falls 
in bit/sek gemessen, bei Kindern altersabhängig wächst, und zugleich die in Sekunden 
gemessene Dauer des SZQ fällt, und zwar so, daß weiterhin (sozusagen als „Fundamen- 
talsatz der Informationspsychologie“) 


()C=1 bit/$ZQ 


gilt. Lehrl (1981) stellte (gegen die Vermutung von Frank, 1962, S. 110, ?1969, Bd. 2, S. 
136f.) empirisch eine positive Korrelation zwischen dem IQ und der Apperzeptions- 
schnelle fest; Roth (1972, *1980, S. 95) hatte dies schon aus der negativen Korrelation 
zwischen IQ und Reaktionszeit in Verbindung mit Franks (1960; 1962, S. 122 - 125) Er- 
klärung der Reaktionszeit als Summe der Apperzeptionszeit und der Zeit für die Assozia- 
tion semantischer Information geschlossen. 


3. Problemstellung 

Der geschichtliche Rückblick zeigt, daß der M/B/P-Versuch nicht nur Auslöser für die 
Begründung der Informationspsychologie wurde, sondern auch zu deren systematischer 
Grundlage, von welcher aus im Laufe der Jahre eine kohärente, zahlreiche empirische 
Einzelerkenntnisse umfassende Theorie aufgestellt werden konnte. (Ihre „Fort- 
schrittsgeschwindigkeit“ suchte E. Cistean [1995] zu messen.) Auch in der hochschul- 
pädagogischen Aufarbeitung der Informationspsychologie spielt dieser Versuch die Rolle 
eines Schlüsselexperiments (vgl. z.B. Frank, 1969, Kapitel 5, und 1996, Kapitel 6). Ins- 
besondere aus diesem Grunde bedürfen drei Mängel seiner bisherigen Auswertung einer 
Behebung: 
1. Nur die Meßergebnisse für Expositionsdauern d> 1 SZQ wurden für die Theorie ver- 
wertet. Für d « 1 SZQ ist die Bedingung (b) augenscheinlich viel genauer erfüllt, was 
nicht einmal zu erklären versucht wurde. 
2. Die mittlere Apperzeptionsgeschwindigkeit der benutzten Versuchspersonen (und - 
wie bei der Nachuntersuchung von Frank und Wagner, 1982, S. 78, geschehen - deren 
wahrscheinlicher IQ) kann und sollte empirisch bestimmt werden, ohne (1) schon voraus- 
zusetzen. 
3. Die Lage des Knickpunktes zwischen den je zwei Ästen der von M/B/P empirisch ge- 
fundenen Kurven sollte bestimmt werden, um festzustellen, ob die Unterstellung, er liege 
bei 1 SZQ, mit den Daten verträglich ist. Den „Fundamentalsatz“ (1) unterstellend kön- 
nen dann die MeBwerte für d < 1 SZQ zu einer genaueren Bestimmung von Apperzepti- 
onsgeschwindigkeit und SZQ-Dauer der Versuchspersonen mitgenutzt werden. 

Die Mitautorin (Faloba, 1997) nahm diese ergänzende Auswertung für ihre Bak- 
kalaureatsarbeit bei der Akademio Internacia de la Sciencoj (AIS) San Marino vor. Im 
folgenden werden die Ergebnisse knapp dargestellt. 
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4. Reiznachwirkungszeit 

Schon von der Sinnesphysiologie (vgl. z.B. v. Buddenbrock, 1952, 1953; 
Rein/Schneider, 1955, u.a.) ist bekannt, daß die Reizung von Rezeptoren, z.B. der Retina, 
mit einer Latenzzeit tı die Sendung von Impulsen an das Gehirn auslöst, und daß diese 
Signale auch noch während einer Zeit 1, > ti nach Reizende gesendet werden. (Eine mo- 
dellhaft vereinfachende Beschreibung dieser sinnes- und nervenphysiologischer Vorgänge 
für informationspsychologische Zwecke wurde in Frank, 1959, S. 21 £., und, ausführli- 
cher, 1962, S. 69 - 87, versucht.) Eine gewisse Reiznachwirkungszeit t,” = tz - t; besteht 
daher schon auf der Stufe der Sinnesorgane. Eine zusätzliche Trägheit kann vom an- 
schließenden Neuronensystem einschließlich der Projektionszentren unterstellt werden. 
Apperzipierbar ist also nicht der Reiz selbst während der Zeit d, sondern seine Abbildung 
in einem zentralnervösen „Ultrakurzspeicher“ in der um eine Gesamtnachwirkungszeit t, 
verlängerten Zeit 

(Q)i=detezdritod 
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Bild 4: Theoretische Deutung von Bild 3A. Zur Reizdauer d kommt eine von der Redundanz, also von H, unab- 
hängige Nachwirkungszeit 4, der Netzhaut und des anschließenden Perzeptionskanals (bis zu den sensorischen 
Projektionszentren bzw. zum Akkomodator) für die Apperzeption hinzu. Die apperzipierte Zeichenzahl z ergibt 
sich als Quotient aus apperzipierter Information Cxf durch die (mittlere) Information H eines Zeichens. 


Durch das wahrnehmungspsychologische Experiment von Averbach und Coriell 
(1961) wird dies bestätigt. Diese Experimentatoren projizierten unmittelbar nach einem 
Bild, das für die auch nur näherungsweise vollständige Apperzeption viel zu informations- 
reich war, an unvorhergesehener Stelle des (inzwischen verschwundenen) Bildes ein klei- 
nes Quadrat; ihre Versuchspersonen apperzipierten dann noch nachträglich alles, was 
sie zuvor an der so umrahmten Stelle perzipiert hatten. 

Die in Abschnitt 2 aufgeführte Bedingung (c) für die psychologische Relevanz des In- 
formationsmaßes ist also trotz des in Bild 3 dargestellten empirischen Befunds als erfüllt 
annehmbar, wenn als Wahrnehmungszeit statt der Reizdauer d die nach (2) verfügbare 
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Apperzeptionszeit t eingesetzt wird (Bild 4). In diesem Koordinatensystem gilt dann - 
statt der (in Bild 4 fett gezeichneten) empirisch beobachtbaren, geknickten Funktion I(d) - 
die Proportionalitätsbeziehung 


(3) 1=Cxi= Cx(d+t;) 


Dabei ist Cx die zu bestimmende, als Apperzeptionsschnelle voll genutzte Kanalkapazi- 
tät C vom Akkomodator zum Kurzspeicher. (Für den Fall des M/B/P-Versuchs wurde 1, 
zu rund % Sekunden geschätzt.) 
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Bild 5; Idealisierung von Bild 3B. Die Reiznachwirkungszeit, nicht aber Cx, steigt mit der Reizintensitat. Bei 
unterschiedlicher Reizintensität (z. B. bei unterschiedlicher Entfernung der Versuchspersonen von der Projektions- 
fläche, wie bei der Nachuntersuchung von Frank und Wagner, 1982) wird also der zweite Ast der M/B/P-Funktion 
parallel verschoben, während beim ersten Ast die Steigung sich ändert (also die Perzeptionsgeschwindigkeit). 


Zur Erklärung des empirisch beobachtbaren Kurvenverlauf /(d) für d « 1 SZQ müßte 
in diesem Bereich die verfügbare Apperzeptionszeit mit der Dauer d schneller wachsen 
als durch (2) erklärt wird; also dürfte 1, keine Konstante sein, sondern eine mit d monoton 
wachsende Funktion 1,(d), die in Bild 4 hypothetisch gezeichnete Ursprungsgerade gilt im 
Spezialfall der Proportionalität: 


(4) 1,(d) = ris(1 SZQ)=: rt, d<1SZQ,0< r=d/SZQ<I1 
(5) t=d+1,(d)=d+1;,d/SZO = d(1+1/SZQ) 


Bild 5 macht augenfällig, wie 1,(d) als monoton steigende Funktion von d unter der 
Voraussetzung der Gültigkeit von (3) allgemein aus /(d) zu ermitteln ist, und daß (nur) 
speziell im Falle der Proportionalität zwischen 7 und d < 1 SZQ hier auch die Nachwir- 
kungszeit zu d proportional ist. 
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Bild 6: Im Falle konstanter Reizstärke wächst (beobachtbar) die apperzipierte Information, also die (theoretisch 
erschlieBbare) Apperzeptionszeit f proportional zur Reizdauer d < 1 SZQ. Sie setzt sich additiv aus dieser 
Reizdauer und der zu ihr bis d= 1 SZQ proportionalen Nachwirkungszeit zusammen. Der Knick der Funktion /(d) 
entfällt daher bei der Funktion /(7): die apperzipierte Information ist proportional zur Apperzeptionszeit. 

r 


Bild 7: Sinnesphysiologische Erklärung von Bild 6. 
Bei gleichem Produkt aus Reizintensität und 
Reizdauer (< 1 SZQ) werden Reize nicht als unter- 
schiedlich apperzipiert. Doppelte Reizdauer ist also 
zu doppelter Reizintensität äquivalent und führt zu 
längerer (doppelter?) Reiznachwirkungszeit. 
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Schon vorwissenschaftlich ist zu erwarten, daß der Grenzwert £(1 SZQ) der Nach- 
wirkungszeit für d— 1 SZQ auch für dasselbe Sinnesorgan und dieselbe Versuchsperson 
keine Konstante ist, sondern mit der Reizstärke steigt - und damit nach Konstruktion (Bild 
5) auch jede kürzere Nachwirkungszeit 1,(d), d « 1 SZQ: man „sieht“ nach Schließen der 
Augen eine Lichtquelle desto länger, je heller sie ist. Dies wird durch den wahrneh- 
mungspsychologischen Sachverhalt bestätigt, daß von zwei überschwellig starken, weni- 
ger als 1 SZQ dauernden Reizen nicht sicher empfunden werden kann, welches der län- 
gere bzw. der stärkere ist (Bild 6). Subjektiv vergleichbar sind vielmehr nur die Produkte 
R=d rr dieser beiden Reizdimensionen. Beim M/B/P-Versuch kann unterstellt werden, 
daß bei den Teilversuchen mit Buchstabenketten unterschiedlicher Informacio bzw. Red- 
undanz die Lichtstärke unverändert blieb. Da Redundanz und Informacio auf der Stufe 
der Perzeption noch nicht relevant sein können, muß daher bei gleicher Expositionszeit d 
die Nachwirkungszeit t, für alle vier Teilversuche dieselbe sein - und zwar sowohl im 
Grenzwert (Bild 7), als auch (nach der in Bild 6 dargestellten Konstruktion) für d < 1 
SZQ. Dann aber ist nach (2) die Apperzeptionszeit nur von d, nicht auch von der Redun- 
danz bzw. der Informacio der während der Zeit d gezeigten Buchstaben-8-tupel abhängig. 
Die Übereinstimmung der in Informacio-Einheiten (bit) gemessenen Information, die in 
dieser Zeit apperzipiert wird, besagt dann, daß auch für Expositionszeiten d « 1 SZQ, al- 
so für Apperzeptionszeiten ? « f, + 1 SZQ, die Relevanzbedingung (b) aus Abschnitt 2 
erfüllt ist, also (3) nicht erst für größere Apperzeptionszeiten gilt. (Etwas anderes wäre 
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Bild 8: Bei gleicher Reizstärke hängt die Reiznachwirkungszeit nur von der Reizdauer d « l SZQ bzw. vom 
Bruchteil 7 = d/SZQ ab, nicht vom Informationsgehalt der Zeichen. Soweit die Reiznachwirkungszeit proportional 
zur Reizdauer ist, verlaufen auch die ersten Aste der M/B/P-Funktion (Bild 3A) geradlinig, und ihre Steigung ist 
zu H umgekehrt proportional. Genau dies zeigen die Versuchsergebnisse von M/B/P besonders eindrucksvoll, 
ohne daß es bisher theoretisch aufgearbeitet worden wäre. 
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kaum zu erklären, wenn man die Apperzeption [Bewußtwerdung] als Übertragung durch 
den Kanal vom Akkomodator zum Kurzspeicher versteht.) Damit ist das Zusammenfallen 
der empirischen Kurven auch für d « 1 SZQ in einer mit der Beobachtung für d> 1 SZQ 
übereinstimmenden Weise erklärt, und die empirischen Ergebnisse dieser Versuche mit 
sehr kurzen Reizen bestätigen die Kohärenz des informationspsychologischen Ansatzes. 


5. Theoriegeleitete Auswertung der M/B/P-Daten. 

Ohne zunächst den „informationspsychologischen Fundamentalsatz“ (1) und die 
Nachwirkungsannahmen (4; 5) schon zu unterstellen, berechneten wir aus den M/B/P- 
Originaldaten die Regressionslinien für die Meßwerte in den Projektionszeitintervallen bis 
40 msek bzw. ab 100 msek. Sie schneiden sich an der Stelle dp = 45,3 msek und schnei- 
den die Zeitachse bei d = -1,8 msek bzw. d = -1068 msek (= - ts). Der Ordinatenwert des 
Schnittpunkts (in bit) und die Steigungen der beiden Regressionslinien (in bit/sek) hängen 
vom Informationsgehalt 8H„x der redundanzfreien Zeichen-8-tupel ab. Rechnet man 
Hrnax /bit = ld 27 ~ 4,75, dann erhält man als Ordinatenwert des Knickpunkts /p = 14,3 bit 
und als Steigung der ersten Regressionslinie (Perzeptionsschnelle) ca. 304 bit/sek, für den 
zweiten Ast Cx = 12,85 bit/sek. Unterstellt man jedoch eine Binärcodierung der 27 
Buchstaben durch je 5 Bit oder - sparsamst - von 22 Buchstaben durch je 5 Bit und der 
restlichen 5 durch je 4 Bit, also im Mittel durch ca. 4,81 Bit, dann erhöhen sich Ordina- 
ten- und Steigungswerte um 5,15% bzw. 1,26%. Mit der letzteren Annahme, die am be- 
sten zum Modellansatz paßt, erhöht sich Cx auf 13,01 bit/sek, Die Annahme 


(6) Kd)=Cd für d « 1 SZQ 


ist also mit den Daten sehr gut verträglich. Die Steigung des ersten Astes kann aus der als 
gesichert geltenden Annahme /(0) = 0 daher genauer mit 


(DC=IId Yd? 


zu etwa 322 bit/sek ermittelt werden. (Diese Gleichung entsteht aus der Formel für die 
Steigung der Regressionsgeraden, wenn man den theoretisch gesicherten Punkt [0; 0] »- 
fach den Meßpunkten zufügt und dann n — = gehen läßt.) Damit erhält man für den 
Knickpunkt den verbesserten Wert dp = 44,4 msek. 

Unterstellt man nun die Gültigkeit von (1), dann würde für die Versuchspersonen von 
M/B/P 1 SZQ = 1/13,01 sek = 76,8 msek > 44,4 msek = dp gelten. Die unbefriedigende 
Abweichung dieser beiden Meßergebnisse für das SZQ kann durch die (im Vergleich zum 
ersten Ast) relativ große Streuung der Meßwerte des zweiten Asts der M/B/P-Funktion 
erklärt werden, die eine nur ungenaue Ermittlung der Steigung Cx ermöglicht. Unterstellt 
man eine etwas größere Steigung, dann sinken der Kehrwert 1/Cx sowie die Knickpunkt- 
stelle dp , und man kann iterativ den Koinzidenzwert ermitteln. Dazu betrachten wir den 
ersten Ast der Kurve als gesichert. Bei der Regressionsrechnung für den zweiten Ast ist 
damit der Knickpunkt (d»; Ip) als theoretisch gesicherter Punkt hinzuzufügen. Cx ist nach 
Koordinatenverschiebung durch diesen Knickpunkt nach (7) berechenbar, wenn dort /; 
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durch 7; - Ip “und d; durch a; - dp ersetzt wird. Kriterium dafür, daß der mit den Daten 
bestverträgliche Wert dpin die Regressionsrechnung eingegeben wurde, ist, daß dieses dp 
mit dem Kehrwert 1/Cx der so berechneten Steigung der Regressionslinie numerisch zu- 
sammenfällt. 

Für 1 SZQ = 0,0400 sek erhält man bei dieser Rechnung Cx = 24,9 bit/sek, also einen 
Apperzeptionszeitbedarf von 0,0401 sek/bit. Die (studentischen) Versuchspersonen von 
M/B/P zeichneten sich demnach durch eine erheblich über dem Durchschnitt liegende 
Apperzeptionsschnelle und ein entsprechend feines Zeitauflösungsvermögen aus. Dem 
entspräche nach Lehrl (1981) ein IQ von ca. 140. 
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Provo kompletige ekspluati la ŝlosileksperimenton de la informacipsikologio. (Resumo). 
Miller, Bruner kaj Postman montris 1954, ke dum certa daŭro de taĥistoskopa prezentado oni ja malpli da 
procentoj de litersinsekvo enprenas (kaj povas reprodukti), se la litersinsekvo enhavas pli da informacio, sed ke 
la tiel ricevebla informacio estas la sama (bildoj 1 - 2). El la mezurvaloroj por prezentadtempoj d 2 1 subjektiva 
tempero (SZQ) la informacipsikologio konkludis sian „fundamentan teoremon“, laŭ kiu la aperceptadrapideco 
estas 1 bit/SZQ. La kunfandiĝo de la empiriaj kurboj post transkalkulo de signoprocentoj (bildo l) al informaci- 
valoroj (bildo 2) estas pli okulfrapa por d « 1 SZQ. Pro la konata, supozeble proporcia kresko de la stimulkon- 
servadtempo sur la retino kaj en la sekva perceptadkanalo, la aperceptadtempo superas je la stimulkonservad- 
tempo la stimuladtempon kaj ebligas apercepti proporcian kvanton da informacio jam dekomence. Ĉi tiuj teoriaj 
konsideroj ebligas pli fajne ekspluati la empiriajn datumojn de Miller, Bruner kaj Postman. Montriĝis, ke sia- 
tempe estis je dispono esploritoj kun alta aperceptadrapideco (preskaŭ 24 bit/sek), do - laŭ Lehrl - kun alta inte- 
ligenteckvociento (preskaŭ 140). 
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Didaktischer Test vom statistischen Gesichtspunkt betrachtet 


Stanislav KOMENDA, Olomouc (CZ) 


aus der Medizinischen Fakultät der Palacky Universität Olomouc, Tschechien 


1. Problemstellung. Die Rückkoppelung 


Das Lernen spielt eine so wichtige Rolle im menschlichen Leben, daß 15 bis 25 Pro- 
zent dieser mittleren Lebenslänge mit Lernen erfüllt und fast alles weitere Leben vom 
Lernen durchdrungen ist. Eine notwendige Komponente des Lernens stellt die Rückkop- 
pelung dar, die den Informationsfluß über die Kenntnisse des lernenden Subjekts sicher- 
stellt. Solche Information soll durch die Beobachtung und das Messen gewonnen werden. 
Die genaue Darstellung der Kenntnisse der Schüler stellt eine notwendige Bedingung für 
die Leistungsfähigkeit eigener Tätigkeit des Lehrers dar, denn nur dann kann er diese Tä- 
tigkeit flexibel modifizieren und anpassen. Die Prüfung aller Art, Testen der Kenntnisse 
ist praktisches, alltägliches Messen im Dienste der Rückkoppelung und Regelung eines 
pädagogischen Prozesses. 


2. Induktive Auffassung 

Die Kenntnisse sind nicht erschöpfend zu messen; dazu genügt es zu bemerken, daß 
auch das Testen allein das Gemessene beeinflußt. Die Kenntnisse zu messen - es bedeutet 
nur eine Auswahl aus dem möglichen Raum dem Prozeß des Testen zu unterwerfen - was 
notwendigerweise von Bemühungen die partiellen Befunde für eine breitere Situation zu 
verallgemeinern begleitet ist. Aus den Antworten auf eine kleine Fragenmenge sind die 
Schlußfolgerungen über die komplexen Kenntnisse des Ganzen zu ziehen. Prüfen - bedeu- 
tet generalisieren, verallgemeinern. Prüfen bedeutet Induktion - mit allen Problemen, die 
einen solchen Prozeß notwendigerweise begleiten: nämlich den Irrtum zu riskieren, daß 
die existierenden Kenntnisse nicht erkannt werden oder die Ignoranz nicht diagnostiziert 
wird. Es gibt eine wissenschaftliche Disziplin, die sich ausschließlich mit den Problemen 
der Induktion beschäftigt, die mathematische Statistik. Dieser Gegenstand existiert schon 
seit hundert Jahren, mit Anwendung von statistischen Methoden in der Psychologie, Bio- 
logie, Medizin wie auch in der Ökonomie - und es gibt keine Argumente, warum sie auch 
auf dem Gebiet der Pädagogik nicht angewendet werden dürften. 

Wir sollten aber etwas präziser sein - die Methoden der mathematischen Statistik sind 
in der pädagogischen Domäne nicht unbekannt. Eher handelt es sich um die Häufigkeit 
der Anwendungen und um eine Ansiedlung der statistischen Methoden in dem Instrumen- 
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tarium der pädagogischen Forschung. Es handelt sich also darum, daß die statistischen 
Konzepte zum Ausgangspunkt für die Auffassung der pädagogischen Phänomene und zu 
Bestandteilen der Struktur der pädagogischen Begriffe werden. Es geht darum, daß - 
analogisch zur Psychometrie, Anthropometrie, Soziometrie, Ökonometrie und Biometrie - 
auch der Inhalt des Gegenstandes, der mit dem Namen Edukometrie bezeichnet werden 
sollte, erfüllt werde. 


3. Die Kenntnisse und deren Prüfung 

In unserem Konzept sind drei Stufen der Kenntnisse zu unterscheiden: 

(a) Der Raum der wirklichen, aktuellen Kenntnisse des Subjekts von den zu prüfenden 
Themen. Die Tiefe der Kenntnisse wird im Sinne der Bloomschen Taxonomie verstanden. 
Diese Stufe ist nicht durch eine direkte Messung ergreifbar - und darf als Anteil des nicht 
beherrschten Lehrstoffes konzipiert werden. 

(b) Die Stufe der wirklichen Kenntnisse, die das Subjekt von dem geprüften Thema 
hat, äußert sich indirekt durch die Lösungen der Testprobleme (Testfragen), die eine 
(zufällige) Auswahl aus der Menge aller möglichen Probleme darstellen. Es ist deswegen 
sinnvoll von der Ebene der Kenntnisse, die das Subjekt von den Testfragen hat, zu spre- 
chen. Wenn sich die Prüfung auf einem multiple-choice Test gründet, manifestiert sich 
diese Ebene durch einen Wert an der Testskala (Score der falschen Antworten). Der ent- 
sprechende Wert ist die einzige für den Lehrer zugängliche Informationsquelle von den 
Kenntnissen des Subjekts. Die Effizienz dieser Quelle wächst mit der Verbundenheit der 
Antwort mit den wirklichen Kenntnissen des Subjekts. Diese Verbundenheit ist statistisch 
ergreifbar - in der Form der entsprechenden Wahrscheinlichkeitsverteilungen - und des- 
wegen sollten auch diese Kenntnisse statistisch gemessen werden. 

Die bedingten Wahrscheinlichkeitsverteilungen sind als die Informationskanäle zu be- 
greifen, durch die die Information aus dem Raum der wirklichen Kenntnisse zum Raum 
der ergreifbaren Antworten des Subjekts hinfließt. 

(c) Der zufällige Mechanismus der Auswahl der Testfragen im Raum der wirklichen 
Kenntnisse wird auch damit modifiziert, daß wegen der Auswahl der Antworten aus der 
für jede Testfrage angebotenen Menge der Antwortalternativen - auch das Subjekt, das 
von dem Teilproblem nichts weiß, die richtige Antwort mit einer positiven Wahrschein- 
lichkeit erreichen kann. Die Intensität dieses Faktors hängt davon ab, wieviel unrichtige 
Alternativen (Distraktoren) zur Auswahl des Subjekts mit der Frage angeboten wurden 
[2,5]. 


4. Parameter des Tests 

Hiernach soll die Situation eines Subjekts im Test untersucht werden mit dem Ziel, 
den Anteil der bei ihm wirklich vorhandenen (bzw. der nicht vorhandenen) Kenntnisse zu 
beurteilen. Der Test möge n Fragen (Problemen, Aufgaben) enthalten, die als voneinander 
unabhängig angenommen werden. Wir setzen also voraus, daß die Kenntnis der richtigen 
Lösung auf jede Aufforderung keinen Einfluß auf die Möglichkeit habe, auf die jeweils 
übrigen Aufforderungen des Tests richtig zu reagieren. 





116 Stanislav Komenda 





Durch den Test wird dem Subjekt zu jeder Aufforderung eine Menge von g Antworten 
(Alternativen) zur Auswahl angeboten. Der Test ist so konstruiert, daß nur eine einzige 
Antwort richtig ist; g-1 Antworten sind also immer falsch (und in der Rolle der Distrakto- 
ren angewendet). Dieser Umstand sei dem Subjekt bekannt. Es führt dazu, daß die rich- 
tige Antwort auch zufällig, durch Raten, gefunden werden kann. 


5. Die Kenntnisse und das Testergebnis des Subjekts 
Wir bezeichnen mit dem Symbol den Anteil des dem Subjekt unbekannten Lehrstof- 
fes bezüglich einer Aufforderung (0 < z< 1) siehe Abb.l. 





Abb. 1 


Dieser Parameter soll mit Hilfe des Testergebnisses geschätzt werden. Das Symbol p be- 
deutet die Wahrscheinlichkeit, daß das Subjekt auf eine zufällig ausgewählte Aufforde- 
rung eine falsche Antwort gibt. Nach dem Satz für die totale Wahrscheinlichkeit erhält 
man als Beziehung zwischen den Größen und p [2,4] 


l-p=(l-n)lar4 bzw. 


-1 
1 „i 
(1) Bee, 


Daraus folgt, daß - wegen der Möglichkeit eines zufälligen Erfolges des ignoranten 
Subjekts - die Wahrscheinlichkeit p einer falschen Antwort kleiner ist als der Anteil z des 
unbekannten Lehrstoffes. 

Aus (1) läßt sich die inverse Wahrscheinlichkeit dafür berechnen, daß das Subjekt, 
das auf die zufällig ausgewählte Testfrage richtig geantwortet hat, auch wirklich die ent- 
sprechenden Kenntnisse hatte. Diese Wahrscheinlichkeit ist (dem Satz nach Bayes ge- 
mäß) 
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P(R|K) PK) 
P(R|K) P(K)+P(R|K) PIK) 
wobei die Symbole folgende Ereignisse bezeichnen 
K.... das Subjekt kennt das Problem 


K ...das Subjekt kennt das Problem nicht 
R.... das Subjekt antwortet richtig 





P(K|R) = 





so daß 
1(1- 
Pin — I 
LU-mi-m 
q 
lm = g(l-a) 
a a+gl-m) 


q 
Daraus ergibt sich die komplementäre Wahrscheinlichkeit dafür, daß bei richtiger Be- 
antwortung einer Frage keine Stoffkenntnis vorhanden ist (die richtige Antwort nur zufäl- 
lig erraten wurde) 
ee Lao 
ziq(l-m)' 


Durch diese Methode der inversen Wahrscheinlichkeit kann man auch feststellen, daß 
ein Subjekt, das eine zufällig ausgewählte Frage falsch beantwortet hat, mit der Wahr- 
scheinlichkeit Eins das entsprechende Wissen nicht besitzt. 


6. Die Kenntnisse und die Anzahl der unbekannten Fragen 

Unter der Bedingung, daß der Anteil x des Stoffes nicht bekannt ist, läßt sich die 
Wahrscheinlichkeit dafür, daß / Aufforderungen (0S / < n) des Testes in diesen unbe- 
kannten Bereich fallen, ermitteln mit 


n\ı ~I 
(2) Pülem=|}r (1-7)" 


Diese Beziehung wurde unter der Bedingung einer gleichmäßigen Verteilung der Auf- 
forderungen (Testfragen) über das geprüfte Stoffgebiet abgeleitet. Die Situation ist in 
Abb.1 für den Fall n=10 und /=4 dargestellt. 


7. Die Anzahl der unbekannten und falsch beantworteten Fragen 

Die Aufforderungen aus dem Bereich des vorhandenen Wissens werden mit Sicherheit 
richtig beantwortet. Daneben kann es einige Fragen aus dem Bereich des nicht vorhande- 
nen Wissens geben, die ebenfalls richtig beantwortet werden. Die Zusammenhänge lassen 
sich schematisch folgendermaßen darstellen (siehe Tabelle 1). Die Wahrscheinlichkeit, 
daß unter den / Fragen aus dem Bereich des nicht vorhandenen Wissens k Fragen falsch 
und /-k zufällig richtig beantwortet werden, läßt sich durch die Binomialwahrscheinlich- 
keit 
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ermitteln. Dabei handelt es sich um die bedingte Verteilung der Zufallsveränderlichen X 
(Anzahl der Fehler im Test) unter der Bedingung, daß / Aufforderungen des Tests in den 
Bereich der vom Subjekt nicht beherrschten Kenntnisse gefallen sind, X50.1,...,]. 

Die Zufallsvariablen X (die Fehleranzahl) und Y (die Anzahl der Fragen aus dem Be- 
reich des nicht vorhandenen Wissens) unterscheiden sich wesentlich: die X-Werte sind 





n-k richtige Antworten 


n-l Fragen aus dem Bereich des 


vorhandenen Wissens 


n  Aufforderungen des Tests 
Tabelle 1 





direkt beobachtbar; die Y-Werte bieten keine Möglichkeit einer direkten Beurteilung. Für 
die theoretische Wahrscheinlichkeitsverteilung der Zufallsvariablen X erhält man 


P(X = kin) = P(klLa) Pllx,n) 
I=k 


ea)” 


Wie man sieht, nähert sich die Wahrscheinlichkeitsverteilung (4) mit wachsendem q 
der Binomialverteilung (2). Der Zusammenhang dieser Variablen ist durch Abb. 2 darge- 
stellt. 


(4) 


P(NT;n) 





P(kl8;n,q) 
Abb. 2 


8. Die Maximum-Likelihood Schätzung des Parameters m 
Man kann beweisen, daß für z keine erwartungstreue Schätzung existiert [4]. Deshalb 
suchen wir nachfolgend eine Maximum-Likelihood Schätzung $ von z in Abhängigkeit 
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von der Zahl k der falschen Antworten. Zur Ableitung wird der Wert # gesucht, für den 
(4) ein Maximum (im Intervall (0,1)) annimmt. Als Lösung erhält man (siehe Abb. 3) 

















Abb. 3 
= —I_ wenn ksn Liao. 
nq-1 q 
(5) RR 
1=l, wenn k »n = 


Abb. 4 zeigt den Verlauf der Schätzung für den Fall n = 20, q=4. 
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Abb. 4 


9. Der Mittelwert der Maximum-Likelihood Schätzung 
Für den Mittelwert der Schätzung (5) bekommen wir den Ausdruck 


E(Ai7 = sal» ani n-Lx mi + 
q q 


"ar Si | N,T = 
q q 


wobei [x] den ganzen Teil von x und B(k | n, p) die Distributionsfunktion der Binomialver- 
teilung bedeuten. Die Schätzung (5) ist verzerrt (biased); der Mittelwert (6) fällt niedriger 
als der wahre Parameterwert z aus. Die Größe der Verzerrung konvergiert sowohl mit 
wachsendem Antwortsangebot q als auch mit zunehmendem Testumfang n gegen Null. 
Für den an der Abb. 4 gegebenen Fall ist der Verlauf des Mittelwertes in Abhängigkeit 
von zin Abb. 5 dargestellt. 


(6) 


N 
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Abb. 5 


10. Die Streuung der Maximum-Likelihood Schätzung 
Die Streuung der Schätzung (5) berechnen wir mittels der allgemeinen Formel 


D(#|r) = E(#?|r)- E’(A|r). 
Nach einigen Berechnungen erhält man 


D(1|7) = ll» Lu -2n-2,x l 
n q q 





(ND ;I= al» = 1) 
q q 


Im Spezialfall eines didaktischen Tests mit freier Antwortwahl (ohne Antwortvorgabe, 
d.h. mit g > co) reduziert sich (7) zu 
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(8) D(517) = ~r (1-7), 


zur Streuung der Binomialverteilung. Die Abhängigkeit der Streuung (7) vom wahren Pa- 
rameterwert z und der Zahl der Antwortvorgaben q ist für den Fall eines Tests mit einem 





02 03 04 05 06 07 908 09 10 


Abb. 6 

Umfang von n = 20 in Abb. 6 dargestellt. Mit Hilfe der Streuung (7) kann man auch die 
Zuverlässigkeit eines didaktischen Tests bewerten: Die Genauigkeit der aus dem Tester- 
gebnis abgeleiteten Schätzung des wirklichen Niveaus der Kenntnisse eines Subjekts ist 
der Streuung dieser Schätzung umgekehrt proportional. Die Streuung sinkt mit zuneh- 
mendem Testumfang rn und mit wachsender Anzahl der Antwortvorgaben. Daraus folgt, 
daß ein Test mit einer kleineren Anzahl von Antwortvorgaben im Vergleich zu einem Test 
mit größerem g einen größeren Testumfang n erfordert, um eine vorgegebene Genauig- 
keitsgrenze der Parameterschätzung zu erreichen. In Abb. 7 ist für den Fall, daß der An- 
teil des nicht beherrschten Stoffes am Stoffumfang des Tests n = 0,25 beträgt, die Ab- 
hängigkeit der Streuung von n und q veranschaulicht. 





Abb. 7 
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10. Bayessche Schätzung der Anzahl der auf den Bereich nicht beherrschten Stoffes ent- 
fallenen Fragen 

Die Zufallsveränderliche Y wurde als Anzahl der Testfagen eingeführt, die auf den Be- 
reich des nicht behandelten Stoffes entfallen. Die entsprechenden Werte der Variablen 
wurden mit / bezeichnet. Wir betonten, daß diese Werte nicht direkt beobachtbar sind. 
Unter der Voraussetzung, daß das Subjekt den Anteil z des Lehrstoffes nicht beherrscht 
hat und daß der Test n Aufforderungen enthält, ist die zufällige Veränderliche Y „a priori“ 
der Binomialwahrscheinlichkeit P(7 | 7) (2) gemäß verteilt. Die bedingte Wahrscheinlich- 
keitsverteilung der direkt beobachtbaren Veränderlichen X unter der Voraussetzung, daß / 
Fragen auf den Bereich des nicht beherrschten Stoffes entfallen sind, wurde durch P(k|D) 
in (3) angegeben. Hierbei spielt / die Rolle des Verteilungsparameters. Die Randvertei- 
lung der Veränderlichen X wurde durch die Binomialwahrscheinlichkeit (4) eingeführt. 
Mittels der Bayesschen Formel [3,4] 


PO P&|D 

Ik) =————— 
(9) P(1|k) Pk) 
kann die Wahrscheinlichkeitsverteilung der Zufallsvariablen „a posteriori“ abgeleitet 
werden. Setzen wir die entsprechenden Ausdrücke ein, so bekommt man die Binomialver- 
teilung 


n-k nx == g(1-7) ii 
(10) ruo (1 =] boreo) 


(=kk+l,..,n) 
(k=0,1,...,n) 

Aus (10) kann der Mittelwert der Variablen Y in Abhängigkeit von X, d.h. die Re- 
gressionsfunktion von Y bezüglich X, abgeleitet werden. Sie stellt eine Schätzung von Y 
bei einem beobachteten Wert von X dar 


& q(l-z) nx 
p ES en, azia) 





Der Ausdruck ist linear in k. | 
Für k = 0 (keine falsche Antwort im Test) kann man erwarten, daß für das Subjekt in 
Wirklichkeit 


Elllk =0)=n— — 
a )=n zig(l-m) 
Testfragen aus dem Bereich des nicht beherrschten Stoffes stammen. 

Für k = n (alle Testfragen wurden falsch beantwortet) kann man E(!lk = n) = n erwar- 
ten. 
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Die Bayessche Schätzung hängt vom Zufallsergebnis k ab. Deshalb ist es zweckmä- 
Big, ihren Mittelwert und ihre Streuung zu bestimmen. Es gilt dabei 


E, (E,(I|k)) = nz, 


d.h. der Mittelwert der Bayesschen Schätzung (11) ist gleich dem Mittelwert der unbe- 
dingten Verteilung (2). 


Der Ausdruck 





1 
(12) D{E/lk)} =nz(1 A) 


stellt die Variabilität der Regressionsfunktion £ (/ | k) um den gemeinsamen Mittelwert 
E(0) dar. Die totale Streuung der Zufallsveränderlichen Y kann in zwei Komponenten ge- 
teilt werden. Die erste ist durch (12) gegeben, die andere ist der Mittelwert der Reststreu- 
ung D (1 | k) der bedingten Wahrscheinlichkeitsverteilung (10). Weil diese eine Binomial- 
verteilung ist, wird die Streuung durch 


MOSE A | 2 0 
PP AO To eco 


angegeben. Fŭr ihren Mittelwert erhält man 


(14) EDU) =i(1-9j, —L—, 
zeq(l-x) 

Das Verhältnis der beiden Streuungskomponenten hängt von x und q ab, nicht aber 
vom Testumfang n. Die Reststreuung dient dabei als Maß für die Wirkung des Zufalls, 
daß bei der Auswahl einer Antwortvorgabe eine richtige Antwort nicht nur auf Grund 
vorhandenen Wissens, sondern auch durch Raten erreicht werden kann. Dieser Anteil 
sinkt mit zunehmender Anzahl der Antwortvorgaben von einem Minimum 1/(2-7) für q = 
2 bis zu 0 fürg=o. 


11. Empirische Bayessche Schätzung des Parameters x 

Setzen wir voraus, daß der gegebene didaktische Test in einer Gruppe von N Subjek- 
ten angewandt wurde und daß eine „a priori“ - Wahrscheinlichkeitsverteilung F(z) in ei- 
ner Population der Subjekte existiere. Die Randverteilung der Anzahl der Fehler k in ei- 
nem didaktischen Test mit n Fragen und q Antwortvorgaben für jede Frage wird dann 
durch das Integral 


(15) P(b)= | P(k|x) dF (x) 
0 
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gegeben, wobei P(k|z) die bedingte Verteilung (4) ist. Wichtig ist, daß sich (15) durch die 
empirische Häufigkeitsverteilung N(k)/N, k = 0,1,...,n, in der Gruppe von N Subjekten ab- 
schätzen läßt. 


Die „a posteriori“ - Verteilung des Anteils 7 des nicht beherrschten Lehrstoffes in der 
Untermenge der Subjekte, die im didaktischen Test k Fehler gemacht haben, kann dann in 
die Form 


P(k|z) dF(7) 
P(k) 


1 7 q 1 k q 1 n-k 
=—[| || a7 1) dF(r) 
Zi q ) | q 
gebracht werden. 


Diese Formel ermöglicht den Mittelwert der Parameterfunktion z(g-D|(g-z(9g-D) zu 
berechnen 


dF(r|k) = 
(16) 





un Z mad | l Er Pkt) 
q-x(4-1) n-k PIRO 


Nimmt man jetzt die relativen Häufigkeiten N(K)/N anstatt P(k), so bekommt man die 
Beziehung 





(18) a r(q-)D la EO 
q-x(q-l) n-k N(k)' 


die für jeden beobachteten k-Wert (k = 0,1,..., n-1) die empirische Bayessche Schätzung 
z(k)von x bietet [1,2] 





ga Ok 
(19) z(k)= ur 
q-l1e8p MED 


Durch die Bayessche Schätzung wird ein Prinzip quantifiziert, daß ein Lehrer bei der 
Bewertung eines Schülers mehr intuitiv anwendet: Er bezieht außer der aktuell gebotenen 
Leistung auch dessen frühere Ergebnisse und die Leistungen der anderen Kollektivmit- 
glieder in die Bewertung ein. 
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School - achievement test from the statistical viewpoint (Summary) 

When the knowledge the subject has about the topic under consideration is to be assessed, three levels 
are reasonably recognized: (a) the ratio x (O<szsl) of the topic under examination unmastered by the 
subject, (b) the number / among the z items of the test the subject does not know, and (c) the number 
k(Osksl) of the test items answered incorrectly by the subject (which is expected to be lower in 
comparison with / due to the non-zero chance for the ignoring subject to reach the correct response by 
guessing). 

The methods of inductive statistics make it possible to estimate numerical values of the test parameters / 
and z as well as by means of the immediately observable number of false responses k. The method of 
maximum likelihood, inverse probability and the empirical Bayes procedure were applied as well. The 
basic properties of the estimates thus obtained were derived and the respective formulas found. The key 
points of the procedures under consideration were demonstrated in graphical form. 


Lernejsukcesa testo el statistika vidpunkto (resumo) 

Se la scio, kiun havas la subjeko pri la konsiderata objekto, devas esti stimata, oni racie akceptas tri 
nivelojn: (a) la procentaĵon x (OX7x1) de la ekzamenata temo nekonata de la subjekto, (b) la nombron 
1 el la n testeroj, kiujn la subjekto ne konas, kaj (c) la nombron k (0<k</) de la testeroj malĝuste 
responditaj de la subjekto (kiun oni supozas malpli granda kompare kun / pro la ne-nulo ŝanco por la 
nescianta subjekto atingi la ĝustan respondon per divenado). 

La metodoj de induktiva statistiko ebligas stimi numerajn valorojn de la testparametroj / kaj z samkiel 
helpe de la direkte observebla nombro de malĝustaj respondoj k. La metodo de maksimuma 
probableco, inversa probablo kaj la empiria procedo de Bayes estas ankaŭ aplikataj. La bazaj ecoj de la 
stimataĵoj tiel ricevitaj estis derivitaj kaj korespondantaj formuloj estis trovitaj. La ŝlosilpunktoj de la 
konsiderataj procedoj estis montrataj en formo de grafikaĵo. 
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A Mathematica] Analysis of Problem Situations - Structure and MAPLE 


by Josef BRODY, Montreal (CND) and Milan HEJNY, Prague (CZ) 


from Department of Mathematics and Statistics, Concordia University, Montreal and from Department of 
Mathematics and Didactics of Mathematics, Faculty of Education, Charles University, Prague 


Introduction 

In order to make this article self-contained, we refer the reader to our report (Brody, 
Hejny and Rosenfield, 1996), where more elaborated views including details and proofs, 
could be found in. In Part 1 (Brody, Hejny, 1997) we have introduced the following 
Problem Situation PS: 


Two men went for a walk. They left their hotel shortly after their lunch at 2 P.M. and 
walked to the top of a hill. They returned to their hotel using the same route and 
taking no longer than they did on the trip uphill. They wanted to be in the hotel by 8 
P.M. 


In this PS we identified the following objects: 


distance in km: one-way (d) - up or down, total (dt); 

times in hours: up (tu),down (ta), total (tt), difference (f) - of tu and td; 

speed in km/hour: up (su), down (sa), overall (so); 

coefficients (with no measurement»): (ct) - ratio of tu and td, 

Based on these we defined the object set 0 = (d, dt, tu, td, tt, t, su, sd, so, cd), and a 
free situation Sf = [d, dt, tu, td, tt, t, su, sd, so, ct]. To a free situation we assign x eRıo 


denoted by Sf := x and get a concrete situation Sc = (Sf:= x). The set of (such all) 
concrete situations is denoted by 09, 


Since not every Sc satisfies the PS we defined two kinds of relations: 


1) Rc - the set of all comparative relations. All Sc satisfying Rc' are meaningful. The 
set 0 is the set of all meaningful assignments x eRıo; 





TA concrete situation Sc satisfies a set of relations R means that Sc satisfies every relation r € R. 
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2) Rd - the set of all determinative relations. All Sc satisfying Rd are feasible. The set 
S pais the set of all feasible assignments x € Q. 


Any relation r is a mapping: Rıo—>{TT, IF} (where T' stands for true and IF for false). The 
characteristic set: Z, = (x €e Ro: (Y=T) is called the domain of the relation r. To 
every x eQ and i e (1,..,10) we define the i-projection of the domain 
Sg D=VeO: [nr axo] eX,). We call relation r a 
determinative relation on Q if? for every x e Q the i-projection of Y, is either a 
singleton, or the i-projection of QO: Q(X;?) = y € RI [Xu MX so] xD). If 
the i-projection of I, is a singleton we call the index i and the object o; (the i- th 
component of Sf) dependent on r. If the i-projection of Y, is Q(X;i) we call i and o; 
independent of r. The number of objects dependent on r is called the size of r , denoted 
as: o, = |r| and the set of all dependent objects on r is denoted by 6,. 

Let n...,r, be determinative relations on Q. Then the domain of S= (7,...,Z, )is 
given as I,,= NS. A determinative relation r is said to be a logical consequence of S 

lo" 

if Y. cY.. The set of all logical consequences of S is called the envelope of S' and 
denoted by $,,= env(S). We call S a dependent set if there is a relation 


env 
keS:()2, cY, (i.e. r is a logical consequence of S- (7;). In the opposite case S is 
je | : 
said to be an independent set. 
Let S be a determinative set of relations. An independent set CS! = %,, is 


called a basis of S. If Sı is another basis of S then it was shown that |Sb|= |S,|. This 


common number of relations is called rank of S and denoted by rank (S) which also 
defines the dimension of S,,, as dim (S,,)= o. 


All the above notions and ideas concerning our “two-knights’ walk” problem 
situation can be generalized to a general Problem Situation PS, with 6 = f01,...,On), 


Sf =[o,,...,0,], x=[X,..-X,] ER, Sc=(5f:=xX,QcR,Y (XxDCAXDCNR, eto. 


1. Structure ofa problem situation 

In this article we consider only such determinative sets of relations 5 which have a 
non-empty domain. Therefore we have rank (S) £|0| i.e. the number of relations in any 
of its bases cannot exceed the number of objects in 0. In this section we shall discuss an 
algebraic structure of infinite set env(S) = Rd of all determinative relations which are 
logical consequences of S. 





2 iff means if and only if. 
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Definition 1.1: Let S be a determinative set of relations. Then we define dimension of 
Rd denoted by dim(Rd) as the rank(S) bana 

In our example the set of objects 8 = {d ‚dt, tu, id, tt, t,.su, sd, so, ct) has ten elements, 
therefore any determinative set of relations $ has rank(S) < 10. Let us introduce all 
intrinsic properties of our problem situation PS and define the following set of 
determinative relations $ = Su where sı = (dt = 24), s; = (tt = tu +1d), 5 = (= 
tu - 1d), sa = (su = dtu), ss = (sd = dita), se = (so = 2d/t0), s7 = (ct = tuftd). We can see 
that each of these relations s; “introduces” one object o; (on the left side of its defining 
equation) which depends only on s;, i.e. does not depend on any other relations s;, where i 
#j. This property makes these (seven) relations obviously independent. To underline this 
“simplicity” we state: 

Definition 1.2: Let S = {sı,...,s»} be a determinative set of relations such that Rd = 
env(S). Let 05 be the set of all objects dependent on S an for each i = 1,...,p exists an 
object o; € Os such that o; is dependent on s; but does not depend on any (other) s;, where i 








£j. Then Sis called a canonical basis of Rd pasa. 

Definition 1.3: Let 8(PS) be a set of all objects in a problem situation PS. Let Tps 
with domain %,,, be a determinative set of relations which captures all intrinsie 
properties of the problem situation PS. Let the set Ops c 0(PS) be the set of all objects 
dependent on Tps.* Then we call the couple Sps = [8ps, 2.ps] the structure of the problem 
situation PS. The determinative set of relations Rps = env(Tps) is called the relation space 
ofthe problem situation PS. We call the dimension of the relation space the dimension of 
the problem situation PS and denote it by dim(PS). The number of objects in Ops is then 


called the size of problem situation PS and denoted by s(PS) = 6 = | 0psl bara, 
Comment: Obviously we have dim (PS) = dim (Rps) = rank(Tps) pam. 
In our example we have 9ps = 8, s(PS) = 10, Tps = S, Rps = env (5), and dim (PS) = 7, 
With each of the above relations we can associate a function; for example with the 
relation s; we can associate the function f, : fi. (x)= x; 4 x4 -Xxs, and see that 


xe), if f, (x)=O Generally we have: 

Definition 1.4: A relation s is associated with a function f,: R—» IR, denoted as 
so f,ifx eX, if f(x) =0 papa. 

Let us discuss our example with the set of all meaningful concrete situations Q C Rıo. 
The determinative relation (above) s2 is associated with f. (5, 9 f,,), where 








Ss =%3 +%4 7 %s, defines the set of all objects dependent on 52:0,, where 0, = (tu, td, 
ti) c 8. Each of the objects in 9, depends on the other two, Le. 
Xa Xa -xs = 0 IE Zu = -xa bXs(= fo (x,,x5)), za = -a kAS(= fa (X),X5)), Xo = Xa KA 
(= fs (33, x;)). We shall write f, (x) instead of f, (%3,X%4,%5), since the other seven 





3 In part one we used rd; instead of simpler notation s; we prefer to use here. 
4 This means that for each o € 8ps exists a relation r € Tpssuch that o depends on 7, i.e. 0 € 0... 
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values are assigned to the seven independent objects of the relation s2. We can therefore 
write f,.(x„) instead of f,.„(x4,x5)f,.4(X,) instead of f,.(X,,x5), and f(x.) 
instead of f. «(X3,X,). 5 We shall now state the following definition: 

Definition 1.5: Let i e (1,...n),O c IR, and Q, = Ur,}e R,-.ı. A function 


xeN 
f:9R, associated with a determinative relation s, is called i-solvable on Q if there 


exists f.; :O;  R. that for every x =[r,...x,]e Q: f,(x)=0 iff x; = f,,@,) and. 
In the above example the function da is i- solvable on Rıo for i = 3,4,5. However, we 


are only interested in its solvability for meaningful concrete situations, i.e. on the set 0. 
This places the point x; into Q; (= U(x.;) c Rs), x4 into Q,, and x.s into Qs. More 
xel 
generally: 
Theorem 1.1: Let Q be the set if all meaningful concrete situations of a problem 
situation PS and r a relation associated with F,. Then for every i : 0; € 0, the function f, is 


i- solvable on OQ iff r is a determinative relation (in 2) p>< 
Comment: Let 71,...,7; be determinative relations such that 7; > doj Ltg’ R,-» R 


be such that: g(0) = 0. Then we denote the relation r associated with g(f, ,....f,) by 
g(F1,-..,Fx) babi 

Comment: From theorem 1.1 it follows that the relation »= g(rı....,rx) is determinative 
on Q iff the function g(/, „-...f, ) is i- solvable on Q for every i: 0; € 8,„DxIDx], 

In our example we can se that the relations s, > f.:Ĵ.(x)= x; tx, - Xs and 
Ss» f.:f. (X)=X; = Xa, -x,. From these two relations we can now “create” (infinite 

3 3 

number of) new determinative relations (s) like r = g($,, „f., )“ = 5, h 53 €» 2X3 — Xs -Xe. 
We can also see that is a logical consequence of the determinative set of relations S = 
{52,53}. More generally we have: 

Theorem 1.2: Let rı,...,r, be determinative relations on Q such that 7; I . Let g: 
IR,» IR. be such that g(0) = 0. Let for all dependent objects o; on relation r = B(r1,...,7x) 
the function gU, siri In be i- solvable on Q. Then r is a determinative relation which is 


a logical consequence of the determinative set of relations S = {rı,...r.} Di. 


2. Solving processes 
Since in our example we have dim(PS) = rank(5) = 7, there must exist a triple of 
“independent” objects 0°°= (0; ,o;,,0;,) C Ops such that any assignment of the other seven 


objects 0” =.t0,, 0,3 0ps depend on the assignment of the three in 6”. Therefore it 





5 Realize tha x,=[X,,....X.1,Xw1,..„Xio]€ Rais the i-th projection of x. Here i=3,4,5 
6 The function 9 : R»— R is 9(&y) = x + p, i.e. 9(0,0) = 0 and is 1 (and 2)-solvable since g(x,y) = 0 iff x = fi(y) = 
-y and y = f(x) = -x. 
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follows that the (j,,...j7); 7- projection of Ys: Ys (X; J1,..J7) is a singleton for every 
feasible x es. We refer to such three objects as “independent” (of each other). This 
leads us to the following notions: 

Definition 2.1: Let PS be a problem situation with the structure Sps = [0ps, Y»s], 
relations space Rd, size s(PS) = o and dimension dim(PS) = 6. We call a set 0" c Ops a 
dependent set of objects within the structure Sps iff there exists a relation r e R40, c 8”. 
In the opposite case we call the set 0'” an independent set of objects within the structure 
Sps DID. 

Then it is obvious that: 

Theorem 2.1: Let 0; c 0”” c 05 c Ops. If 0° is a dependent set of objects in structure 
Sps then so is 05. If 0°’ is an independent set of objects in structure Sps then so is 0; 5xiba, 

Definition 2.2: Let PS be a problem situation with the structure Sps = [Ops, 2.ps], size 
s(PS) = o, and dimension dim(PS) = 8. Let p = 6 — ö and let 6”= to, 0, )be an inde- 
pendent set of objects within the structure Sps. Then the (i,,...,i5); 0 —projection of 
Oo >> ps X. „15)is a singleton for every x e IR. This projection is associated with 
the set 6° ={0, 0,3 called a basic object set and object in 0° is called a basic object. 
The complementary set 0°’ = 0ps - 0° is called a parameter set and each its element a non- 
basic object. The feasible values x TEE FE assigned to non-basic objects in order to get a 


feasible partial concrete situation Spec, „; = (Sf :=x, ee are called parameters. 


The size p of the parameter set is called the degree of freedom df(PS) = 9 of the problem 
situation PS papa. 

Comment: The degree of freedom p gives the number of a“maximum sized” 
independent set of objects 0°’ within the structure Sps, while the dimension ĉ establishes 
the number of independent relations in Tps. Since p~ ö= o we consider the two sets (0ps 


and Tps) mutually dual. The duality is actually between the (infinite) set of feasible 
concrete situations 09 over Ops and the (infinite) set of all determinative relations Rd over 


Tps Papa. 
Definition 2.3: Let 0 05, .„„.$ be such that the (i,„..is),o —projection 


Ses(5i,-..is)is a singleton for each feasible x. Then the related projection vector 
function fps; „„„ = [frag fra is called a solution with respect to 0’, and the 
relations7; „...,/. given by equations: 


“e fesi, Ku) dm Fosi Ku a) 





7 = . OE 

Note that X.y, „„;.; = [X »-- eD ape amo „A. ] where i, „...,is indicate the 6 blank 
positions of X. tij js)" 
$ That means that each set 02 > 0° such that 0; # 6?” is already a dependent set of objects in structure Sps. 
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are called a canonical basis with respect to 8 The process where a parameter set 0?” is 


the input and its canonical basis is the output is called a solving process m. 
Comment: There are many canonical bases in every problem situation PS. However, 


the maximum number of them is limited by the combinatorial number 2: Some 9- 


tuples may be dependent and therefore the binomial number (3) is generally only the 


upper bound on the number of canonical bases D<><. 
In our example we have degree of freedom 9 = df (PS) = 3, dimension 6 = dim(PS) = 
7 and size o = s(PS) = 10, so the upper bound on the number of canonical bases is 


2) = 120. However, some triples are dependent e.g. 0°’ =(tu, td, tt), since the relation 


sx; fu + td = tt is defined on 0°”. Actually there are 28 dependent triples. All the other 92 
triples are independent. This means that there are 92 canonical bases in our problem 
situation PS. The corresponding solution strategies can be found by means of 
mathematical software, e.g. MAPLE. One of the 92 independent triples is 0° = (su, sd, 
d). It gives the following canonical basis: 

n: tu=d/su pi ti=d(sd + su)! sd.su 

Bi td=d/sd ni t=d(sd- su)! sd.su 

rn dt=2d rn. sa =2su.sd | (sd = su) 

Hi sc=sd/ su 


All such independent parameter sets 0°’ represent 92 open problems since each such 
independent triple generates a canonical basis which in turn defines an assignment for 
each of the remaining seven non-basic object. Each such assignment represents an 
extension of a partial concrete situation 

Spcy: Spcy= (Sfps!= Xa) = (Sfps = Ka Ko) 
where 0° is the basic set, to a (full) concrete situation: Sc = (Sf: = x ). This is why the 
MAPLE-solving process for each independent triple ends with the allocation of the 
corresponding canonical basis. 


3. Experimenting with MAPLE software 
The choice of MAPLE was bases on the capability of the MAPLE function solve. The 
procedure (program) REL(N;M;P) contains three parameters which have to be chosen 


by the user. These parameters are natural numbers (N<o,M<P «(9)» After 


execution of this procedure, MAPLE generates a list of all N- tuples (not yet printed). The 
order of these is made up by the package from the MAPLE library COMBINAT, 
CHOOSE. The user’s choice of the parameters M, P makes MAPLE to list all of these N- 
tuples starting with the M-th and terminating with the P-th. Let us denote (0, ,...,O; ) = 





? Remember that the set of parameters 0?” is the complement to 6' in 9ps i.e. 0”= Ops - 0°. 
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0” C 8ps. If 0?” defines a dependent set of objects, no solution is presented!®. If 60”” defines 
an independent set of objects, the canonical basis with respect to 0°’ is presented. 

Let us assume that the program was informed about the object set Ops and the relation 
set Tps. Let us further assume that the problem Situation PS has size o; dimension 6, and 
the degree of freedom g. Each student starts with filling inside of the procedure the 
particular set of objects 0ps, the determinative set of relations Tps and the size o. When a 
user is equipped with experiences which enable him/her to penetrate into difficult 
concepts such as independence and duality, then the above procedure, offers the 
following possible situations: 


1.IEN p, then the procedure (randomly) adds p - N objects to each N- tuple, which 
indicates that each partial concrete situation is under-determined. 


2. I£N = 9. each independent set of objects 0°’ produces the canonical basis with respect 
to 0” and a dependent set 6°’ does not produce anything. This enables the user to 
experience notions of dependent objecis, independent objecis degree of freedom of the 
problem situation p, and its dimension 9. 


3.IE N> 9, each object set 0°’ produces no solution, which indicates, as mentioned 


above, that all N - tuples are dependent and each corresponding partial situation is 
over-determined. 


4. Comparison of| T»s| and p with the size o lets the user know whether the relation set 
Tps is independent or dependent. In case that observed | Tps | + p = othe relation set is 
an independent set, i.e. a basic one, and | Z»s |= dim(PS) = 6. I|Tps |+ 9 a; then 
HT = dim(PS) = ö and the relation set is a dependent set and contains a basic subset 
S CTps such that|S|= 6= or-o (already observed in case two above). 


In cases one to three the student works with the set of objects 8ps, while in case four 
he/she can observe the relation space Rd and its duality with the space of all concrete 
situations 09. Besides this experimental view into the structure of the problem situation PS 
one can also realize the expansions of a large quantity of determined partial concrete 
situations SpC into a full concrete situation Sc, since each canonical basis consists of all 
necessary formulas and the only remaining step is their use for calculation. 


Conclusion 

1) We do believe that profound difficulties in Linear or Abstract Algebra for university 
students are in the traditional lecturing theoretical approach to these subjects and lack of 
concrete models. 


2) According to our teaching experiences the described analysis of a problem situation 
enables students 





19 For example a dependent triple (tu, ta, tt}. 
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— to penetrate into notions like relations, (in)dependence, basis, duality, etc. and 
applying this knowledge to MAPLE LN | | 

— to create several different and well elaborated concrete situations which equip 
students with experiences necessary 

— to get insight into theoretical concepts. 


3) If in addition the student is a future teacher of Mathematics this knowhow enables 
him/her to individualize his/her teaching approach. 
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Praha 5 


Matematika analizo de problemaj situacioj. Strukturo kaj MAPLE. (Resumo) Een 
Ni evoluigis aliron al la problemsolvado, uzeblan en analizado de problemsituacio helpe de =. e 
objektoj, rilatoj, projekcioj, sendependeco, bazo, dimensio ktp. En tiu ĉi artikolo ni volas — = = 
kaj dualecon de la spaco de ĉiuj konkretaj situacioj 89 kaj la spacon de ĉiuj determinaj rilatoj Rd. MAP es s 
uzata por listigi ĉiujn eblajn kanonikajn bazojn de la diskutata problemsituacio. Ni montras, kiel o 
helpas la analizon de ambaŭ spacoj 89 kaj Rd. Studentoj havantaj spertojn ebligantajn pensii en malfacilajn 
konceptojn kiel sendependeco kaj dualeco, kiuj estas fundamentaj en subjektoj kiel lineara aŭ do N, 
poste uzas MAPLE por eksperimenti en la donita problemsituacio. Plue nia studo celas identigi obstaklojn, kiuj 
kaŭzis, ke tiuj subjektoj estas instruataj je fomala nivelo sen iu ajn serioza kompreno. 
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Analyse syntaxique combinant deux formalismes au sein d'un Chart hiĉrarchique 
de Pierre-Olivier EL GUEDJ et Pierre NUGUES, Caen (F) 


Membres du laboratoire GREYC, commun a l’Institut des Sciences de la Matiĉre et du Rayonnement et a 
PUniversite de Caen, Caen (F). 


1 Jntroduction 

Cet article decrit un analyseur syntaxique utilisant deux methodes d’analyses com- 
plementaires (El Guedj 1996; El Guedj & Nugues 1996; El Guedj & Nugues 1994). 
Lorsqu’on considere la langue francaise, on peut distinguer deux niveaux de structures 
syntaxiques. Le premier niveau correspond a des structures dont l’ordre des mots est tres 
precisĉment defini: il s’agit de ce qu'on appelle commundment les groupes syntaxiques 
(nominal, verbal, prepositionnel). Ces entites syntaxiques sont caracterisees par une cer- 
taine rigidite structurelle et P’utilisation d'une grammaire formelle (Chomsky, 1957) 
s’avere ĉtre un moyen adĉquat permettant de les decrire puis les reperer au sein de la 
phrase. 

Le second niveau de structure concerne les relations qui existent entre ces groupes 
syntaxiques. Du fait de la mobilite de certains de ces syntagmes au sein de la phrase, une 
grammaire de dependances (Tesniĉre, 1959; Mel’cuk, 1988; Covington, 1990) se r&vele 
ŝtre plus appropriĉe pour traiter ce second niveau structurel. Une telle grammaire permet 
d’etablir les differentes relations hiĉrarchiques et fonctionnelles qui existent entre les di- 
vers groupes syntagmatiques. 

L'utilisation concertee de ces deux paradigmes de representation syntaxique permet 
d’optimiser la reconnaissance syntaxique des phrases et d’ameliorer la robustesse des 
analyseurs. De plus, application d'une technique similaire a celle des etiqueteurs lexi- 
caux (Chanod & Tapanainen, 1995) 3 un niveau non plus lexical mais syntaxique permet 
encore d'amĉliorer le processus d’analyse des phrases en &liminant les segments ne pou- 
vant s’integrer avec le reste de la phrase. 
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Nous avons &value cet analyseur sur un corpus d’ordres oraux de navigation ainsi que 
sur une cinquantaine de phrases d'un corpus de comptes rendus medicaux provenant du 
Centre de traitement anti-cancĉreux Frangois Baclesse de Caen. 


2 Architecture du systeme et principe de fonctionnement 

L’architecture du systeme d'analyse syntaxique se developpe autour d'une structure 
de Chart (Kaplan, 1973; Kay, 1973; Gazdar & Mellish, 1989). Cette structure permet de 
stocker les hypotheses ainsi que les conclusions partielles de l’analyse en cours. Trois 
modules agissent directement sur les donnĉes contenues dans le Chart: !e module de seg- 
mentation syntagmatique, le module d’elagage et le module d’analyse des dependances 


(Figure 1) 


Certains de ces modules construisent des hypotheses et les developpent pour aboutir ä 
des conclusions partielles. D’autres, au contraire, se chargent d’effectuer un tri parmi ces 
conclusions afin de favoriser celles qui sont admissibles et de mettre de cöte celles 
presentant un defaut de coherence ou de vraisemblance. 










Mots Module de 
— ; 
segmentation 
syntagmatique 
















Module 
kre a2 d’analyse des 
Bag dependance 


Figure 1: Schĉma conceptuel du systeme 


3 L’organisation hierarchique du Chart 

Du fait de l’interaction de plusieurs modules sur le Chart, nous avons divise le Chart 
en plusieurs niveaux conceptuels 3 partir desquels les differents modules peuvent inter- 
venir (Figure 2). Notre Chart organise les informations en fonction de la richesse de leur 
interĉt et du niveau de complexite qu’elles representent. 
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Niveau 5 : Arcs de dĉpendances inclus 
dans l’analyse active 
Niveau 2 : Arcs syntagmatiques s’integrant dans la sequence 
syntagmatique de l’analyse 


Niveau 1 : Arcs syntagmatiques non inclus dans une 
sequence syntagmatique 


Niveau 0 : Aros lexicaux et arcs de constructions 
syntaxiques intermediaires 


Figure 2: Interaction des trois modules avec les differents niveaux hierarchiques du Chart 
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Le niveau 0 est reservĉ aux arcs portant des hypotheses et des conclusions non syn- 
tagmatiques (Arcs lexicaux ou constructions syntaxiques intermediaires). Le niveau 1 cor- 
respond au premier niveau syntagmatique. C’est & ce niveau que le module de segmenta- 
tion syntagmatique depose ses conclusions. Le module d’elagage examine l’ensemble de 
ces conclusions et dĉplace au niveau 2 les arcs syntagmatiques ayant satisfait aux conditi- 
ons d’acceptabilite exigĉe par ce module. Les syntagmes ne remplissant pas les conditi- 
ons requises sont conserves au niveau 1 qui constitue donc une zone d’archivage des 
conclusions non retenues pour la suite de la resolution de analyse. 

Le niveau 5 est reserve aux structures de donnĉes intĉgrant les relations de depen- 
dance et de rattachement mises en place par le module d’analyse des dependances. Ces 
relations de dependance concernent exclusivement les arcs syntagmatiques presents au 
niveau 2. Le module d’analyse des dependances peut generer plusieurs analyses possibles 
de la phrase si elle presente des ambiguites au niveau de sa structure. Toutes ces analyses 
sont consultables mais on ne peut activer qu'une seule analyse ä la fois. Elle peut corres- 
pondre a un choix ĉtabli par le systeme, l’utilisateur ou un module externe pour une etude 
ou un traitement particulier (affichage, analyse semantique...). Les niveaux 3 et 4 servent 
respectivement 3 archiver les arcs syntagmatiques et les arcs de dĉpendance incompati- 
bles ou non utilises par l analyse active. 


4 Le module de segmentation syntagmatique 

Le module de segmentation syntagmatique repere les groupes syntaxiques presents 
dans la phrase. Il contient un analyseur syntagmatique derive des algorithmes utilises 
habituellement dans les systtmes ä base de Chart (Earley, 1970; Wiren, 1992). Il ac- 
complit une analyse de gauches a droite. Lors de l’ajout d'un mot au Chart, l' algorithme 
classique d’Earley considere toute la phrase deja analysĉe pour tenter de combiner l’arc 
du nouveau mot avec ceux dĉja presents dans le Chart. 

Notre algorithme de segmentation cherche 4 diminuer cet espace de recherche en ne 
concentrant l'analyse formelle que sur un segment de la phrase: le syntagme en cours 
d’analyse (Figure 3). Cette portion de phrase, appelĉe &galement fenĉtre d’analyse, est 
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delimitĉe par les deux ncuds (ou vertex) du Chart entourant les mots concernes. On 
nomme le neud de gauche, le point d'ancrage. C'est a partir de lui que le module fonde 
son analyse formelle. L’analyse syntaxique s’effectuant de gauche ĉ droite au fur et 4 
mesure de la reception des mots, le noeud de droite correspond toujours au dernier naud 
du Chart. Un nceud ne peut ĉtre un point d’ancrage qu’ä deux conditions que nous appel- 
lerons les conditions d’ancrage: 


— Soit le neud considere correspond au premier nceud du Chart; 
— Soit il s’agit d'un noeud relie transitivement au nceud 0 par une composition d'arcs in- 
actifs porteurs chacun d'un groupe syntagmatique complet. 


Chemin transitif reliant le noeud 0 au 
noeud 3 








GN->DETN® 


DET(Le) N (chat) 





Syntagme nominal en 
cours d'analyse 


Syntagme nominal Groupe verbal 






Point d’ancrage Fenĉtre d’analyse 


Figure 3: Exemple de segmentation syntagmatique en cours de rĉalisation. GN decrit un groupe nominal et GV,un 
groupe verbal. DET, N, VT, et ADJ sont les abrĉviations respectives de döterminant, nom, verbe transi- 
tif et adjectif. 


Au commencement de l’analyse, le point d’ancrage correspond au nceud 0. Au fur et ä 
mesure que les mots sont analyses, le module construit le ou les groupes syntaxiques 
partant de ce point d'ancrage. Quand le dernier mot regu ne peut s'integrer dans le groupe 
syntagmatique en cours d’analyse, on considere alors que ce mot appartient a un autre 
syntagme. On deplace alors le point d’ancrage vers la droite sur un noeud constituant la 
fin dun groupe syntagmatique et on relance le processus. Si on ne trouve pas un tel 
noeud, on en deduit alors que ce dernier mot est incorrect et on le rejette. La segmentation 
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syntagmatique s’effectue par bonds successifs vers les extr&mites des syntagmes dĉja 
analysĉs. La segmentation appliquĉe ä la phrase ambiguĉ 


la belle ferme le voile 


permet d'obtenir un treillis des groupes syntagmatiques presents dans la phrase (Figure 
3). 


(0) la O belle G ferme G) le 
Mu; 





Syntagme Syntagme 
pronominal verbal 
es e, SINE? ; 
nominal 





nominal Synt 


nominal 


Figure 4: Treillis final des syntagmes presents dans la phrase 


5 Le module d’elagage 

Lorsqu’on considere le treillis de la Figure 4, on remarque au moins un syntagme dont 
la presence ne semble pas se justifier. En effet, | interpretation du mot /a en tant que syn- 
tagme pronominal ne peut ĉtre consider&e comme acceptable pour deux raisons. En pre- 
mier lieu, il n’existe pas de phrases affirmatives oŭ un tel pronom est suivi par un adjectif, 
un tel syntagme est generalement place entre le groupe sujet et le groupe verbal. De plus, 
m&me en considerant des formes syntaxiques ou stylistiques autorisant une telle con- 
struction, on remarque que ce syntagme s’incorpore mal ä la phrase, car il n'est suivi par 
aucun autre syntagme. Il s’agit donc d'un rĉsultat que [on peut assurĉment mettre de cte 
du fait de son incompatibilit& avec le reste de la phrase. Cette analyse de la coherence 
d'une solution est rĉalisĉe par le module d 'elagage. 

Le travail effectu& par ce module repose sur l’application d'un principe simple qui 
consiste a explorer le voisinage immediat d’un syntagme pour vĉrifier s’il forme, avec ses 
voisins, une sequence acĉeptable. Cette technique s’apparente a celles utilisees dans les 
programmes d”etiquetage lexical (Brill, 1995), sauf que, dans notre cas, on se place 3 un 
niveau syntagmatique. Ce contröle s’effectue par des regles de precedence qui indiquent 
les differents bigrammes syntagmatiques possibles (Figure 5). 


Un syntagme n'est acceptable que si au moins l'un de ses predĉcesseurs directs forme 
avec lui un bigramme syntagmatique correct. On applique aussi la r&ciproque de ce prin- 
cipe: un syntagme ne pouvant s’associer avec aucun de ses successeurs est considere 
comme incorrect. 
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Sequences admissibles Explications Exemples 

GN GV Un groupe verbal peut suivre un groupe Je vois une voiture 
nominal 

PRONOM. ANTE GV Un pronom objet peut preceder un groupe Je la vois 
verbal 


GN PRONOM ANTE Un pronom objet antepos€ peut suivre un Je le regarde 
groupe nominal 





Figure 5: Exemples de regles de precedence 


On effectue donc un double balayage des sequences syntagmatiques pour que ce con- 
tröle soit r&alise sur chacun des deux cötes de chaque syntagme. Les segments ne 
possedant pas de predecesseurs ou de successeurs (a l’exception evidente des syntagmes 
de debut et de fin de phrase) sont &galement ĉcartes. A cause de ce manque de voisin, ils 
ne font manifestement pas partie d'une sequence syntagmatique reliant les deux ex- 
tr&mites de la phrase et ne peuvent donc s'integrer a Pensemble de celle-ci (Figure 6). 







. Syntagme 1 Syntagme 4 Syntagme 7 


. 





Syntagme 2 Syntagme 5 





Syntagme 3 


Figure 6: Treillis comportant deux syntagmes non integrables au reste de la phrase par manque de voisins : les 
syntagmes 1 et 6. 


La mise a l’Ecart d'un ou plusieurs arcs syntagmatiques peut entrainer que leurs 
voisins ne soient plus acceptables. Le programme effectue donc un balayage des diffe- 
rents segments de gauche ä droite puis de droite A gauche jusqu’ä ce que l”on ne constate 
plus d’exclusion. 


6 Le module d’analyse des dependances 

Le module d’analyse des dependances se charge d’accomplir la derniĉre €tape de 
Panalyse a partir des el&ments du niveau 2. Pour cela, il cherche 3 £tablir, au niveau 3 du 
Chart, des liaisons de dependance entre les divers syntagmes retenus. A cause des diver- 
ses ambiguit&s qui peuvent persister a ce niveau de l'analyse, l'algorithme de dependance 
se fonde sur un systeme de recherche en profondeur. A chaque &tape de l’analyse, il 
choisit la dĉpendance ou le syntagme le plus probable. Ce choix repose sur l’application 
d’heuristiques topologiques. Quand un choix entre plusieurs possibilites se presente au 





———— he 
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cours de l’analyse, le systeme effectue un tri sur les differentes options qu’il peut suivre. 

Les heuristiques topologiques utilisĉes pour organiser ce tri sont les suivantes: 

— Quand plusieurs syntagmes sont en concurrence au dĉpart d’un mĉme sommet, on 
privilegie le syntagme le plus long. 


— Quand plusieurs dependances sont en lice pour &tablir une tĉte — un rĉgissant — sur un 
syntagme, on privilegie la dĉpendance pour laquelle la distance entre le syntagme a 
rattacher et sa tĉte est la plus courte. 


L’application de ces heuristiques permet d'obtenir une liste ordonnĉe des differentes 
possibilites. Apres cette phase d’ordonnancement, l’algorithme poursuit l’analyse en 
considerant l hypothese en tĉte de liste. En renouvelant ce processus sur tous les seg- 
ments restants, on aboutit ä une premiere analyse complete. On stocke alors la solution 
trouvĉe et on compte le nombre de syntagmes sans tĉte qu’elle contient. Ce nombre cor- 
respond au critere que nous avons retenu pour Evaluer la qualite d'une analyse syntaxi- 
que: plus ce nombre est faible, meilleure est la fiabilite de | analyse. 

L’algorithme revient ensuite sur le dernier choix laisse en suspens et explore une nou- 
velle analyse en considerant Ihypothĉse suivante. Si, au cours d'une telle exploration, on 
s’apergoit que le nombre de syntagmes sans tĉte ĉtablis par ce parcours depasse celui de 
la meilleure solution, on abandonne cette analyse. Si, par contre, une exploration d&bou- 
che sur une solution &quivalente voire meilleure que la precedente, on stocke cette nou- 
velle solution et on met 3 jour le score &tabli prec&demment. De cette maniĉre, on re- 
streint l’espace de recherche en ne s’attachant qu’aux solutions jugĉes les meilleures 4 un 
instant donnĉ de l’analyse. La Figure 6 presente une illustration du r&sultat genĉre par 
Panalyseur pour une des phrases du corpus. 


7 Implantation, resultats et applications 

Le systeme decrit a et& implante en C++ en tirant parti de la programmation orientĉe 
objet. Il a ete developpe avec la perspective d'une utilisation sous divers environnements 
parmi lesquelles Windows et Unix. La version sous Windows benĉficie d'une interface 
graphique permettant d’etudier et d’ameliorer dans de bonnes conditions le fonctionne- 
ment du programme. 

L’analyseur syntagmatique present dans le module de segmentation a &t& integre au 
sein d’un systeme de dialogue oral. Cette application consiste en la mise en cuvre d'un 
agent conversationnel de navigation permettant 4 un utilisateur de se deplacer ä la voix au 
sein d'un environnement de realite virtuelle (Godĉreaux et al., 1996). L’analyseur rĉalise 
une analyse purement formelle permettant de couvrir la quasi totalite des ordres de 
dĉeplacement du corpus que nous avons collecte pour cette application. 

Nous avons €galement €valu€ notre systeme sur un €chantillon de 54 phrases issues 
d'un corpus de comptes rendus medicaux. La combinaison des deux premiers modules a 
donne de tres bons resultats. Le module de segmentation a detecte plus de 93% des seg- 
ments attendus. Une seule phrase de l’&chantillon n'a pu ĉtre segmentĉe totalement par 
Vanalyseur a cause d'une incise entre une prĉposition et son groupe nominal. Sans ce cas 
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particulier, le taux de couverture des segments correctement detectes aurait atteint plus de 
99,5%. 


VORNE ce jour NI) gm, ‚de diametre, NI 
Groupe Complement  Ponctuation Groupe Complement Ponctuation 
2 nominal denom 
Complement 
cop de nom 
quin = Kkmtemenamtin ei Gulo, 
Conjonction Groupe Groupe Adjectif 


nominal verb ; 
ML Suj j a Attribut 


Conjonction 








compte-tenu de la mauvaise consistance 


Compl&ment 
Complement de cause de nom 


Complement de nom 


Figure 7: Exemple de mise en relation des segments pour une des phrases du corpus 


Ces resultats sont cependant accompagnes d'une surproduction de segments im- 
portante avec plus de 191% de segments incorrects par rapport au nombre de segments 
attendus. Le module d'ĉlagage apporte un gain incontestable au niveau de la precision du 
systeme en &liminant plus de 82% de ces segments incorrects, faisant ainsi tomber le taux 
de surproduction aux alentours de 33%. Les resultats obtenus par le module de depen- 
dance portent sur les phrases ayant passĉ avec succes les deux premiĉres phases de 
l’analyse. Nous avons donc exclus de l”€chantillon la phrase qui avait posĉ quelques dif- 
ficultes au module de segmentation 3 cause d'une incise rejetĉe par la grammaire de 
l’analyseur. Certaines des 53 phrases restantes pouvant ĉtre interpretees de multiples 
maniĉres, un ensemble de 107 analyses plausibles d'un point de vue semantique a €te 
ĉtabli comme modele d’analyse de Pĉchantillon. Sur ces 107 solutions, l’analyseur en a 
trouv& 88 sans aucune erreur (82,2 % ). Si on fait abstraction des erreurs mineures de 
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catĉgorisation ou de typage des segments ou des relations, ce taux de r&ussite monte ä 
83,2 90. 


8 Conclusion 

Nous avons presente un analyseur syntaxique fonde sur les techniques de Chart. 
L’analyse proprement dite se dĉcompose en trois phases. Gräce 34 ces trois phases de 
traitement, le systeme peut construire une analyse progressive. Celle-ci debute au niveau 
lexical, se poursuit au niveau syntagmatique et se termine au niveau de l organisation 
structurelle de la phrase elle-m&me. Cette d&composition permet d’accomplir une analyse 
plus rapide et robuste. 

L’organisation a plusieurs niveaux du Chart favorise l’analyse partielle et devrait per- 
mettre la mise en cuvte d’algorithmes de reprise sur erreur pour traiter les phrases 
agrammaticales. Enfin, nous avons confronte un sous-ensemble de notre systeme ä la na- 
vigation orale dans les mondes virtuels ainsi qu’ä un Echantillon de phrases issues d’un 
corpus de comptes rendus mĉdicaux. 

Les resultats que nous avons obtenus nous permettent de valider notre demarche et 
d’envisager une analyse complete ou partielle de rapports medicaux sans restriction. Une 
telle analyse devrait permettre notamment la mise en cuvre d’outils perfectionnes de re- 
cherche d’informations et de compr&hension automatique de textes. 
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A Parser Combining two Syntactic Formalisms (Summary) 

In this paper, we describe a parser combining a phrase structure grammar, a set of precedence rules and a depen- 
dency grammar. The system is based on a Chart split in several hierarchical levels. These levels correspond to 
different stages of the parsing process managed by three modules. Each of these modules collaborate to the parsing 
bringing its linguistic competence to the system. The Segmentation Module carries out a segmentation of the sen- 
tence to give a lattice of the constituents (Subject, Verb, Adverbial Complements, etc.), structural words 
(conjunctions, ...) and punctuation signs. The Pruning Module carries out a selection among the lattice elements 
in order to retain only the segments which are well integrated with the rest of the sentence. At last, the Dependency 
Parser Module links these segments to construct the dependency graph of the sentence. 


Sintaksa analizo kombinanta du formalismojn ene de la hierarhia ĉarto (resumo) 
En tiu ĉi artikolo ni priskribas analizilon kombinantan frazstrukturan gramatikon, aron de precedentaj leĝoj kaj 
la dependan gramatikon. La sistemo baziĝas sur la ĉarto dispecigita en plurajn hierarkiajn nivelojn. Tiuj ĉi 
niveloj korespondas al diversaj etapoj de la analiziga procezo direktita pere de tri moduloj. Ĉiu el la moduloj 
kunlaboras kun la analizado, alportante sian lingvistikan kompetentecon al la sistemo. La segmentiga modulo 
alportas segmentigon de la frazo por doni kradaron de konsisteroj (subjekto, verbo, adverbaj komplementoj ktp.) 
stukturajn vortojn (konjunkcioj...) kaj interpunkciajn signojn. La foriga modulo alportas elekton inter la kradaj 
elementoj por konservi nur tiujn segmentojn, kiuj bone integriĝas kun la resto de la frazo. Laste, la dependa 
analiza modulo kunligas tiujn segmentojn por konstrui la dependan grafikaĵon de la frazo. 
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